支付宝开放平台-开发者社区——AI 日报「3 月 13 日」

支付宝官方开放平台 2025-03-13 14:26:46

1️⃣李飞飞团队具身智能新作:500美元,一切家务机器人帮你干

量子位|阅读原文

如今机器人又是跑步又是后空翻,但到底什么时候能做上家务给人类养养老?为了挑战这个难题,李飞飞团队带来了具身智能研究最新成果——𝗕𝗘𝗛𝗔𝗩𝗜𝗢𝗥 𝗥𝗼𝗯𝗼𝘁 𝗦𝘂𝗶𝘁𝗲 (𝗕𝗥𝗦),一个解决机器人在家庭任务中全身操作问题的综合框架。并且,其核心组件的实现成本还不到500美元。

机器人学习领域中的一个“圣杯”级挑战是执行通用的日常家庭移动操作任务。借助一款新型双臂移动机器人,我们的最新成果——BRS正在尝试攻克这一极为困难且尚未解决的难题!

根据论文介绍,通过细致分析BEHAVIOR-1K(包含1000项日常家庭活动的机器人测试基准),团队首先确定了机器人成功完成各种家务活动所必需的三项全身控制能力

对此,BRS通过两项关键创新来解决软硬件协同问题:

展开来说,JoyLo(Joy-Con on Low-Cost Kinematic-Twin Arms)通过基于操纵木偶的方法,利用运动学孪生臂和任天堂Joy-Con控制器,实现高效的全身控制。同时提供丰富的用户反馈,优化了策略学习数据质量。

 

2️⃣Open-Sora 2.0全面开源,20万复刻百万级大片!11B媲美闭源巨头,224张GPU创奇迹

新智元|阅读原文

潞晨科技正式推出 Open-Sora 2.0——一款全新开源的SOTA视频生成模型,仅20万美元(224张GPU)成功训练商业级11B参数视频生成大模型。开发高性能的视频生成模型通常耗资高昂:Meta的视频模型训练需要6000多张GPU卡片,投入数百万美元。在多项关键指标上,它与动辄百万美元训练成本的模型分庭抗礼,全面提升视频生成的可及性与可拓展性。

Open-Sora 2.0——全新开源的SOTA(State-of-the-Art)视频生成模型正式发布,仅用20万美元(224张GPU)成功训练出商业级11B参数视频生成大模型,性能直追HunyuanVideo和30B参数的Step-Video。权威评测VBench及用户偏好测试均证实其卓越表现,在多项关键指标上媲美动辄数百万美元训练成本的闭源模型。此次发布全面开源模型权重、推理代码及分布式训练全流程,让高质量视频生成真正触手可及,进一步提升视频生成的可及性与可拓展性。

Open-Sora 2.0采用11B参数规模,训练后在VBench和人工偏好(Human Preference)评测上都取得与用高昂成本开发的主流闭源大模型同等水平。在视觉表现、文本一致性和动作表现三个评估维度上,Open Sora在至少两个指标上超越了开源SOTA HunyuanVideo,以及商业模型Runway Gen-3 Alpha等。以小成本获取了好性能。

GitHub开源仓库:https://github.com/hpcaitech/Open-Sora

 

3️⃣从放弃的AI浏览器到通用Agent:完整复盘 Manus的诞生过程

Founder Park|阅读原文

Monica 的肖弘提过一个困惑,「团队擅长从 0 到 1,抓机会的能力很强,一旦开始 1 到 N,状态就没有那么好」。在他过往的经历中,创业项目大都获得了相对稳定、可观的营收,上一家公司也被成功收购。2023 年,他的新公司「蝴蝶效应」更是以一款浏览器插件 Monica.im,在百模大战的 AI 叙事中错位竞争,成为增长最快、产品体验极佳的 AI 应用之一。看上去,他是一路很顺的创业者。做到这些事情,也才 32 岁。

2024 年,行业人士认为,像 Monica.im 这样带有记忆功能的 AI 助手,会面临来自比如豆包这样的强劲对手的压力,做起来并不会像 2023 年那样容易。Monica.im 有一个很好的从 0 到 1,但未必能冲击 1 到 N。更早之前,很多关注 Monica.im 的声音都假定这件「更难、天花板更高的事」是指传了很久、但团队迟迟未发布的 AI 浏览器。现在看,确实,猜错了。这段更难的探索其实是:放弃已经达到发布状态的AI浏览器、寻找下一个「ChatGPT 时刻」的 AI 产品、找到了通用型 agent 这个目标、做出了最新发布的 Manus.im。

如果你亲自上手体验过 Manus,或者看过演示视频,你会感觉到它和聊天机器人或一些类 agent 应用相比,有一个明显的不同:Manus 可以异步、并行执行任务。当你打开比如豆包、Kimi 或者类 Computer Use 等应用,你和它只能是 A-B-A-B 接力式的对话。在 Manus.im 里,尽管看着还是聊天机器人的产品形态,你却可以提出比如 20 个问题让它同步执行任务。一旁的你可以在电脑上做其他任何事情,看视频、写文档、打游戏等等,都不耽误它工作。

事实上,Manus 对异步体验的产品架构设计,源自团队在上一个未公开的产品——AI 浏览器中学到的一课。同时这也是团队投入了很大精力、但在去年 10 月决定终止做浏览器的原因。

在 Manus 团队看来,「Chatbot 应该在云上有个电脑,把它写的代码、要通过浏览器查的东西都在那台电脑上执行。因为是虚拟服务器,坏了无所谓,可以再来一台。它甚至可以在当前任务执行完之后释放掉那个服务器。」Manus 产品的理念,在其团队的产品实践过程中逐渐明确:即 Less Structure、More Intelligence(更少的结构,更多的智能)。

 

 

 

 

 

 

 

 

对此,你怎么看?

在帖子下积极互动,则有机会获得相关蚂蚁周边和积分!


AI 内容库

欢迎你的投稿!

扫描下方二维码加入群聊,带走蚂蚁周边!

戳我进群

...全文
16 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

4

社区成员

发帖
与我相关
我的任务
社区描述
【蚂蚁集团最新资讯】【开放平台产品技术创新】【开发者社区动态分享】「产品面对面」「开发者日」「程序员节」互动沟通】 关注我~获取支付宝开放平台最新动态
agi 企业社区
社区管理员
  • 支付宝官方开放平台
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧