支付宝开放平台-开发者社区——AI 日报「3 月 25 日」

支付宝官方开放平台 2025-03-25 14:39:00

1️⃣DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了

量子位|阅读原文

DeepSeek V3升级了,新版本V3-0324。官方轻描淡写只说是“小版本升级”,但很多人实测下来可一点也不小。把流行的小球弹跳测试,提升难度到4维空间超立方体也没问题。如果这只是一个小更新,那我想象不出大更新会是什么样子。

编程这块,只需一句提示词开发一个完整产品着陆页,带自适应布局带动效,被评价为与Claude 3.7 Sonnet同一水平。由于发布时间太短,还没有正式测评结果,不过在开发者Xeophon的个人Benchmark上所有指标都有大提升,成为该测试下最好的非推理模型。

在“9.11和9.9那个大”、“Straberry有多少个r”已经不成问题的今天,最新折磨AI的难题是“让7米长的甘蔗通过2米高1米宽的门”。在测试中,DeepSeek-V3-0324先是像它的前辈以及许多其他AI一样碰壁。碰壁之后开始重新思考题目本身的含义,后面依旧陷入误区,但突然在中文解题过程中夹杂一句英语思考,类似DeepSeek-R1技术报告中的“啊哈时刻”。虽然从计算过程看,还是没理解到问题的本质,但好歹得出了解决方案,还认识到了自己的误区。

目前在官网和官方APP(关闭深度思考即可)、HuggingFace等渠道都能体验到v3-0324。也可以到大模型竞技场去与其他模型pk,不过投票结果还要等一段时间才能出来。

 

2️⃣氛围编程师崛起!年薪87万一天15小时,Karpathy用400行AI代码点燃硅谷

新智元|阅读原文

Vibe Coding(氛围编程),如今成为硅谷最新流行语。首次提出这一概念的AI大神Karpathy,再度分享了自己的编程新姿势——用Swift编写首个完整卡路里追踪的iOS应用。

令人惊讶的是,他完全没有Swift编程经验,也没有翻阅任何文档。通过与ChatGPT的多轮对话,Karpathy仅用1小时完成整个开发过程,并成功部署到手机上。

Karpathy如何用嘴,迅速完成一个iOS应用的开发?推文中,他具体分享了自己与ChatGPT对话的四次过程:启动应用;功能增强;使用AppStorage持久化数据;部署到手机。

在启动应用阶段,Karpathy从0开始,告诉ChatGPT自己的需求:刚刚下载了Xcode,希望用SwiftUI构建一个iOS应用。ChatGPT在接下来开启了「手把手」教学。首先安装和启动Xcode,就这个环节已经细致到,打开点击具体某个选项。然后配置项目,包括命名、界面、编程语言等选择。接下来,ChatGPT还提供了基础代码,包括SwiftUI的界面布局和逻辑实现,帮助Karpathy快速搭建了一个可运行的原型。有了原型之后,便开始实操了——构建一个体脂追踪的计时器APP。

虽然氛围编程≠用LLM进行编程,但这并不意味着它是一种不负责任的开发方式。这种突破性的编程形式,实则蕴含着改变世界的潜能——让数百万没有计算机学位或经过编程培训的普通人,也能借助工具,让计算机完成高度定制化任务,打造属于自己的个性化工具。

 

3️⃣英伟达、腾讯混元都发混合架构模型,Mamba-Transformer要崛起吗?

机器之心|阅读原文

在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。在众多非 Transformer 架构中,Mamba 无疑是声量较大且后续发展较好的一个。然而,与最初发布时那种仿佛「水火不容」的局面不同,最近一段时间,这两种架构似乎正在走向融合。

上周五,腾讯宣布推出自研深度思考模型「混元 T1」正式版,这是一个能秒回、吐字快、擅长超长文处理的强推理模型。而之所以具备这些优势,很大程度上是因为腾讯采用了 Hybrid-Mamba-Transformer 融合架构。与此同时,英伟达也推出了一个采用 Mamba-Transformer 混合架构的模型家族 ——Nemotron-H,其速度是同体量竞品模型的三倍。

Mamba-Transformer 混合架构,顾名思义,就是将 Mamba 与 Transformer 架构组合到一起。简单来说:Transformer 架构是一种以自注意力机制为核心的深度学习模型,自 2017 年由 Ashish Vaswani 等人提出以来,便革新了传统序列模型的设计理念。而 Mamba 则是一种状态空间模型(SSM)—— 该架构的一大显著优势是能高效地捕获序列数据中的复杂依赖关系,并由此成为 Transformer 的一大强劲对手。

速度的提升与成本的降低,是 AI 大模型迈向更广泛应用与普及的必经之路。如今,腾讯、英伟达等科技巨头对 Mamba-Transformer 混合架构的高度关注与投入,释放出一个极为重要的信号:此类架构所蕴含的巨大价值,值得我们深入挖掘与探索。

 

 

 

 

 

 

 

对此,你怎么看?

在帖子下积极互动,则有机会获得相关蚂蚁周边和积分!


AI 内容库

欢迎你的投稿!

扫描下方二维码加入群聊,带走蚂蚁周边!

戳我进群

...全文
36 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

6

社区成员

发帖
与我相关
我的任务
社区描述
【蚂蚁集团最新资讯】【开放平台产品技术创新】【开发者社区动态分享】「产品面对面」「开发者日」「程序员节」互动沟通】 关注我~获取支付宝开放平台最新动态
agi 企业社区
社区管理员
  • 支付宝官方开放平台
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧