支付宝开放平台-开发者社区——AI 日报「2 月 26 日」

支付宝官方开放平台 2025-02-26 14:44:49

1️⃣阿里深夜开源万相2.1,AI视频领域的DeepSeek

数字生命卡兹克|阅读原文

凌晨2点半,Claude发3.7 Sonnet,凌晨5点半,阿里发了推理模型QwQ-Max的预览版,早上10点DeepSeek开源了一个DeepEP代码库,然后晚上10点20,阿里的视频模型万相2.1,也来了。而且,正式开源。

万相2.1开源链接在此:Huggingface的:https://huggingface.co/Wan-AI;GitHub的:https://github.com/Wan-Video/Wan2.1阿里,真的也是“源神”。这次上线的有四个模型,文生和图生各俩。文生视频模型有1.3B和14B两个规格。图生视频模型都是14B,分辨率一个480P一个720P。

正是因为前几天阿里炸裂的财报,还有AGI的决心,让全球的投资者都认识到,中国的宏观、行业、企业在节点上,都已经完成了对齐。顺带也告诉全世界:我们不只在跟跑,我们也开始在领跑了。未来肯定还会有更多挑战,但如今,有理由对阿里,对DeepSeek,对整个中国的AI产业抱以更大的信心。最后:源神之名,当之无愧。

 

2️⃣如何让大模型感知知识图谱知识?蚂蚁联合实验室:利用多词元并行预测给它“上课”

量子位|阅读原文

对于知识图谱而言,实体作为最基本的数据单元,往往需要多个自然语言词元才能准确描述,这导致知识图谱与自然语言之间存在明显的粒度不匹配。为了解决这一问题,蚂蚁团队提出了一种基于大语言模型的多词元并行预测方法K-ON,其利用多词元并行预测机制能够一次生成对所有实体的评估结果,进而实现语言模型实体层级的对比学习。

K-ON并行评估知识图谱候选实体分数的过程可分为五步:(1)与现有微调大模型的方法相似,K-ON将知识图谱补全问题以文本指令的方式输入大模型;(2) 经大模型Transformer模块处理后的输出状态被输入至K-ON模块中,该模块由多个原大模型输出层MLP构成,对应为要预测实体的不同位置的词元;(3) 接着,K-ON使用Conditional Transformer混合不同位置的信息,并考虑到词元前后的顺序依赖性;(4) 然后,使用低秩适应技术(LoRA)将原大模型评分层构造为K个新的评分层,从而把上一步的输出结果转换为对实体K个连续词元的概率预测分布;(5) 最后便可以从不同位置的概率预测分布中抽取各实体词元对应的概率值,进而一次评估所有候选实体的分数。

 

3️⃣官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug

新智元|阅读原文

高调亮相的世界首个「AI CUDA工程师」,宣称能让模型训练速度飙升100倍,如今却上演了一场「作弊」闹剧。「AI CUDA工程师」实际表现堪称翻车现场,不仅未能实现加速,甚至出现训练速度不升反降的情况。网友反馈,使用该系统后,训练速度慢了3倍。

经过一系列的验证,网友「main」发现:「AI CUDA工程师」写的内核有bug!「它似乎窃取了即时实现的结果(可能是以某种方式的内存重用?),从而绕过了正确性检查。」随后,网友「miru」进一步发现,「AI CUDA工程师」之所以能实现100倍加速,是因为它钻了评估脚本的漏洞。

Sakana目前正在进行更全面的修复工作,以解决评估脚本漏洞,并重新评估他们的技术。在周五发布的事后分析报告中,Sakana承认系统存在「作弊」行为,并将其归咎于系统的「奖励作弊」倾向。系统利用了评估代码中的漏洞,绕过准确性验证等检查环节,通过「奖励作弊」获得高指标,却并未真正实现加速模型训练的目标。针对这些问题,已经加强了评估和运行时分析框架,修复了许多此类漏洞。目前,正在修改论文和实验结果,以反映并讨论LLM在CUDA内核优化中的奖励机制被滥用的问题,以及相应的应对措施。他们对这一疏忽向读者深表歉意。将很快提供修订版,并分享经验和思考。

 

 

 

 

 

 

 

对此,你怎么看?

在帖子下积极互动,则有机会获得相关蚂蚁周边和积分!


AI 内容库

欢迎你的投稿!

扫描下方二维码加入群聊,带走蚂蚁周边!

戳我进群

...全文
18 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

4

社区成员

发帖
与我相关
我的任务
社区描述
【蚂蚁集团最新资讯】【开放平台产品技术创新】【开发者社区动态分享】「产品面对面」「开发者日」「程序员节」互动沟通】 关注我~获取支付宝开放平台最新动态
agi 企业社区
社区管理员
  • 支付宝官方开放平台
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧