支付宝开放平台-开发者社区——AI 日报「3 月 6 日」

支付宝官方开放平台 2025-03-06 14:12:26

1️⃣一头大象难倒ChatGPT,Grok 3完美通关

量子位|阅读原文

ChatGPT新Bug引热议:无法画出“有0头大象的房间”。ChatGPT也能意识到自己的错误。但重新生成的图中还是出现了大象。确实很多早期未升级过的AI文生图产品都像ChatGPT一样有这个毛病,但比较新的Grok 3就可以生成正常只有家具的房间。

以ChatGPT为代表的AI们是出了什么问题?或许是Dall-E 3作为扩散模型还无法理解否定的含义,提示词中出现了“大象”就会增加大象出现的机会。还有网友分享Midjourney增加了一个特殊的提示词参数“- no”来解决这个问题。

这几天还有一个现象也引起了大家的关注:ChatGPT拒绝画一副玫瑰,因为不符合内容规范。再联系到此前ChatGPT拒绝回答David Mayer是谁,总之OpenAI的内容过滤真是令人困惑。

 

2️⃣全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

新智元|阅读原文

就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」!这一成就,再次让AI社区轰动。「啊哈时刻」指大模型能够自发构建推理策略,重新审视自己的初始方法,来提升自己的推理能力。

UCLA等机构的研究者发现,虽然目前已经涌现出许多试图复现DeepSeek-R1的研究,然而这些研究大多遭遇了这个难点:很难复现出R1所表现出的回答长度增加和思考模式。幸运的是,他们成功了!如同DeepSeek-R1论文所描述的那样,多模态的「啊哈时刻」出现了——模型回答中涌现出了自我反思能力。他们不仅成为全球首个成功在多模态推理中产生了「啊哈时刻」涌现现象和回答长度增加的团队,而且仅仅使用了一个未经监督微调的2B模型。

具体来说,研究者从从Qwen2-VL-2B基础模型开始,直接在SAT数据集上进行强化学习。没有任何SFT的情况下,模型就在CVBench上达到了59.47%的准确率,比基础模型高出约30%,比经过SFT的模型高出约2%。甚至,这个模型大幅超越了指令微调模型,而后者的训练数据明显更多。现在,研究者已经在GitHub上开源了训练代码和关于回答长度的发研究发现,希望能加速AI社区未来对多模态推理的研究。

 

3️⃣对话像素绽放赵充:一年内用户超千万且挣到钱,AiPPT.cn是怎么做的

Founder Park|阅读原文

国内的 AI 办公产品,AiPPT.com 绝对是最不可忽视的一个。产品上线后 4 个月,月活跃用户数便突破了百万大关,2025 年 2 月,AiPPT.com 的全球单月访问量逼近 1400 万,全球排名第 2。

Key Message:

 

 

 

 

 

 

 

对此,你怎么看?

在帖子下积极互动,则有机会获得相关蚂蚁周边和积分!


AI 内容库

欢迎你的投稿!

扫描下方二维码加入群聊,带走蚂蚁周边!

戳我进群

...全文
10 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

4

社区成员

发帖
与我相关
我的任务
社区描述
【蚂蚁集团最新资讯】【开放平台产品技术创新】【开发者社区动态分享】「产品面对面」「开发者日」「程序员节」互动沟通】 关注我~获取支付宝开放平台最新动态
agi 企业社区
社区管理员
  • 支付宝官方开放平台
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧