支付宝开放平台-开发者社区——AI 日报「3 月 12 日」

支付宝官方开放平台 2025-03-12 14:00:01

1️⃣阿里开源R1-Omni,DeepSeek同款RLVR首度结合全模态情感识别

量子位|阅读原文

阿里通义实验室薄列峰团队又开卷了,哦是开源,R1-Omni来了。DeepSeek-R1带火了RLVR(可验证奖励强化学习),之前已有团队将RLVR应用于图像-文本多模态LLM,证明其在几何推理和视觉计数等任务上表现优异。然鹅,尚未探索将其与包含音频、动态视觉内容的全模态LLM结合。

薄列峰团队首次将RLVR与全模态LLM结合,聚焦的是视觉和音频模态都提供关键作用的情感识别任务。团队实验发现,模型在三个关键方面有显著提升:1)RLVR的引入不仅提高了模型在分布内数据上的整体性能;2)在分布外数据集上也展现出了更强的鲁棒性;3)更重要的是,提升后的推理能力使得能够清晰分析在情感识别过程中不同模态所起的作用。

实验结果表明,R1-Omni在三个关键方面优于三个对比模型:推理能力增强、理解能力提高、泛化能力更强。

 

2️⃣OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手

新智元|阅读原文

Manus掀起的智能体风暴,再次逼急了OpenAI。凌晨,OpenAI突然开启线上直播,正式放出开发者自主构建智能体的大礼包——一个全新API、三个内置工具,以及一个开源SDK。

具体包括:

奥特曼开源的诺言终于兑现了一部分——Agents SDK⁠,简化多智能体工作流管理。OpenAI还预告,未来几周和几个月里,还计划发布更多工具和功能,进一步简化和加速在平台上构建智能体应用。

 

3️⃣云计算巨头AI战略分化:谁将定义企业级AI的未来规则?

AIGC开放社区|阅读原文

AI大模型的商业化进程正在重塑云计算行业的竞争逻辑。从2023年的“技术验证年(POC)”,到2024年的“规模生产年”,当企业级客户的需求从追逐单一模型的“极致性能”转向寻求性能、成本、安全与场景适配性的平衡,头部云厂商的战略分野已然清晰——亚马逊云科技于昨天凌晨在Amazon Bedrock平台推出全托管、无服务器的DeepSeek-R1模型,是首个提供DeepSeek-R1作为全托管、正式商用模型的海外云厂商,同时DeepSeek是首个登陆Amazon Bedrock的国产大模型。自今年1月底上线以来,已有数千客户通过Amazon Bedrock的自定义模型导入功能部署了DeepSeek-R1模型。

IDC最新预测揭示:到2028年,80%用于生产级用例的基础模型将具备多模态AI功能。亚太区前1000强企业90%的大模型用例将转向专用小型模型(SLM)。这一转型的直接动因是企业对“性能过剩”的警惕——通过灵活调用模型组合,总拥有成本可下降37%*,印证了“精算时代”的核心逻辑:不为技术光环付费,只为业务价值买单。

 

 

 

 

 

 

 

 

对此,你怎么看?

在帖子下积极互动,则有机会获得相关蚂蚁周边和积分!


AI 内容库

欢迎你的投稿!

扫描下方二维码加入群聊,带走蚂蚁周边!

戳我进群

...全文
15 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

4

社区成员

发帖
与我相关
我的任务
社区描述
【蚂蚁集团最新资讯】【开放平台产品技术创新】【开发者社区动态分享】「产品面对面」「开发者日」「程序员节」互动沟通】 关注我~获取支付宝开放平台最新动态
agi 企业社区
社区管理员
  • 支付宝官方开放平台
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧