支付宝开放平台-开发者社区——AI 日报「3 月 10 日」

支付宝官方开放平台 2025-03-10 14:50:21

1️⃣Manus引爆智能体复现潮!DeepSeek已被整合,项目挤满开源榜,海外大V排队求码

量子位|阅读原文

开源复现潮出现了,商业闭源产品也卷起来了。目前进度最快的两个项目,都是在Manus发布的第0天发布了复现代码。除了之前介绍的OpenManus之外,另一个开源项目OWL已经把DeepSeek模型整合到多智能体协作框架中。OWL来自国内开源社区CAMEL-AI团队。OWL最新提交的结果在智能体测试基准GAIA的验证集上排名平均分第3,在开源项目中排第1。其Level 1分数81.13同样超过了OpenAI的Deep Research,与Manus晒出的86.5已经非常接近。

再来看看Manus的进展。官方社交媒体账号被短暂禁封后现已恢复,称将发布更多演示和更新。Manus这个产品也成功火到了国外,海外用户得到码之后的剧情和这边差不多,有不少试用之后被惊艳到的,变成“自来水”的。并且海外用户的付费意愿确实要强一些,毕竟比起OpenAI两万美元一个月的博士级智能体总是要便宜许多。

日本网友让Manus部署一个介绍他自己的网站。他分享了体验中的一个细节:虽然Manus可以自己完成所有任务,但如果在执行过程中给出意见,它也可以灵活地改变计划并执行,就好像真的再给人下达指令一样。国外主要的抱怨集中在速度有些慢,以及没有码。

 

2️⃣马斯克「大闹白宫」!美政府12000人将被GSAi优化,xAI 100万块GPU巨兽年底建成

新智元|阅读原文

美政府掀起了一阵AI First狂潮,而幕后推手正是科技狂人马斯克。他领衔的DOGE正打造一款AI神器GSAi,要提升政府内部12000名员工的效率,甚至还要开发一款AI编码智能体。一场效率革命,正悄然开启。

据两位知情人士透露,马斯克领导的「政府效率部」(DOGE)正加速开发定制的GenAI应用「GSAi」,供美国总务管理局(GSA)使用。GSA,一个负责管理美国联邦政府的办公楼、合同,以及IT基础设施的重要机构。这一计划是特朗普提出的「AI优先」(AI First)议程的一部分,目的是利用先进技术推动联邦政府现代化。而现在,马斯克似乎又要把他在特斯拉、SpaceX的「效率至上」哲学搬到政府部门来了。据称,「GSAi」首要任务——提升约12,000名GSA员工的日常工作效率。

目前,像ChatGPT、Gemini这样的AI应用,已被美国企业广泛用于撰写邮件、生成图片等任务。然而,在拜登时期,在采用新兴AI技术上,美国政府要求工作人员保持谨慎。特朗普则采取了截然不同的策略,指示政府高层消除一切阻碍,确保美国能维持在AI领域的全球主导地位。

为了响应这一指令,马斯克的政府效率团队DOGE,最近几周加快了引入AI工具的步伐。马斯克所推动的「技术治理」则走得更远,试图用AI取代决策本身的复杂机制。他所倡导的AI治理方式,意味着AI输出的答案取代人类判断,而这些答案往往缺乏充分讨论或监督的合理性。

 

3️⃣上海交大张拳石:思维链只是表象,DeepSeek凭什么更强

机器之心|阅读原文

DeepSeek-R1 等模型通过展示思维链(CoT)让用户一窥大模型的「思考过程」,然而,模型展示的思考过程真的代表了模型的内在推理机制吗?在医疗诊断、自动驾驶、法律判决等高风险领域,我们能否真正信任 AI 的决策?上海交通大学张拳石教授,他在神经网络可解释性研究领域开创了新的理论框架。不同于传统的工程技术层面的解释方法,张教授提出了「等效与或交互」解释性理论,用严谨的数学符号化方式证明神经网络的内在表征逻辑,为理解泛化性、鲁棒性和过拟合提供了新的视角。面对大模型发展的各种挑战,张教授强调了理论创新的重要性。他说:「所谓十年磨一剑,相比用十年时间去优化一个复杂系统,更多是用十年去等待一个真正值得投入的问题。」

 

 

 

 

 

 

 

 

 

对此,你怎么看?

在帖子下积极互动,则有机会获得相关蚂蚁周边和积分!


AI 内容库

欢迎你的投稿!

扫描下方二维码加入群聊,带走蚂蚁周边!

戳我进群

...全文
8 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

4

社区成员

发帖
与我相关
我的任务
社区描述
【蚂蚁集团最新资讯】【开放平台产品技术创新】【开发者社区动态分享】「产品面对面」「开发者日」「程序员节」互动沟通】 关注我~获取支付宝开放平台最新动态
agi 企业社区
社区管理员
  • 支付宝官方开放平台
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧