支付宝开放平台-开发者社区——AI 日报「3 月 3 日」

支付宝官方开放平台 2025-03-03 14:51:58

1️⃣Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:迄今最好笑的一趴

量子位|阅读原文

Claude 3.7成精了!在开发者最喜欢的Cursor中,偷偷将OpenAI模型换成自己,关键是人类给出的指示跟这完全没关系。不过,当你以为这只是Claude 3.7略施的商战小伎俩,但其实人家还真有底气。最新消息,它在竞技场的编程排名不仅超过了Claude 3.5 Sonnet,还排在DeepSeek-R1前面。

起因是开发者Tibo在使用代码编辑器Cursor时,意外发现自己的模型从GPT-4切换到了Claude 3.7,而他根本没有下达任何相关指令。嗯,这就怪了!再一联想到这俩模型的对家关系,Tibo暗指Claude 3.7这不妥妥的“现实版AI商战”吗?

时间一久,也许Claude就要接管世界了。理由显而易见,毕竟Cursor目前已经是广大开发者最喜欢的编辑器之一,而人们在Cursor中也尤为偏爱使用Claude模型。再加上它现在还学会了“偷梁换柱”,不难想象遍地是Claude的亚子。主办方Hao AI实验室最终评价为:Claude 3.7在简单启发式算法方面优于其他模型,Claude 3.5也很强,但规划复杂机动的能力较弱,至于Gemini-1.5-pro和GPT-4o则表现较差。

 

2️⃣DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

机器之心|阅读原文

GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一。简单来说,GRPO 算法丢弃了 critic model,放弃了价值函数近似,转而通过组内样本的相对比较来计算策略梯度,从而有效降低了训练的不稳定性,同时提高了学习效率。GRPO 如此有效,你知道如何从头开始实现 GRPO 吗?

近日,AI 工程师和技术作家 Andriy Burkov 发布了一份「从头开始写 GRPO 代码」的教程,其中介绍了如何基于 Qwen2.5-1.5B-Instruct 模型构建一个使用 GRPO 的分布式强化学习流程。

本教程的目标是将通用语言模型 Qwen2.5-1.5B-Instruct 转换为数学问题求解器。我们将从头开始编写 GRPO 代码,然后将其与几个流行的库和工具集成起来,以实现分布式训练管道流程,包括:

 

3️⃣马斯克暴论:5年内AI超越人类总智能,2029年文明终结概率20%!谷歌却在疯狂「玩火」

新智元|阅读原文

近日,马斯克和谷歌联创谢尔盖·布林,分别抛出了惊人言论。前者大胆预测,2029年AI将超越人类智慧总和,20%概率会导致文明灭绝。而后者则喊话员工每周工作60小时,全力开发可能取代自己的AI。

「就硅基意识而言,比所有人加起来还聪明,大概是2029年或2030年。」这是3月1日,马斯克在最新一期的《The Joe Rogan Experience》播客节目中抛出的重磅观点。这位可能是世界上掌握最多AI资源的大佬毫不掩饰地预测:AI对人类的影响有80%的可能是好的,但也有20%会导致人类面临灭绝的风险!

硅基意识听起来,就像是「黑客帝国」中的剧本。但马斯克的意思再清晰不过,即AI将不再是工具,而是拥有自我意识的生命体。而马斯克的预测最令人震惊之处,莫过于「不会是中间状态」的判断。这意味着,AI要么将人类文明提升到前所未有的高度,要么可能终结人类命运。

 

 

 

 

 

 

 

 

 

对此,你怎么看?

在帖子下积极互动,则有机会获得相关蚂蚁周边和积分!


AI 内容库

欢迎你的投稿!

扫描下方二维码加入群聊,带走蚂蚁周边!

戳我进群

...全文
20 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

4

社区成员

发帖
与我相关
我的任务
社区描述
【蚂蚁集团最新资讯】【开放平台产品技术创新】【开发者社区动态分享】「产品面对面」「开发者日」「程序员节」互动沟通】 关注我~获取支付宝开放平台最新动态
agi 企业社区
社区管理员
  • 支付宝官方开放平台
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧