支付宝开放平台-开发者社区——AI 日报「3 月 6 日」

支付宝官方开放平台 2025-03-06 14:12:26

1️⃣一头大象难倒ChatGPT，Grok 3完美通关

量子位｜阅读原文

ChatGPT新Bug引热议：无法画出“有0头大象的房间”。ChatGPT也能意识到自己的错误。但重新生成的图中还是出现了大象。确实很多早期未升级过的AI文生图产品都像ChatGPT一样有这个毛病，但比较新的Grok 3就可以生成正常只有家具的房间。

以ChatGPT为代表的AI们是出了什么问题？或许是Dall-E 3作为扩散模型还无法理解否定的含义，提示词中出现了“大象”就会增加大象出现的机会。还有网友分享Midjourney增加了一个特殊的提示词参数“- no”来解决这个问题。

这几天还有一个现象也引起了大家的关注：ChatGPT拒绝画一副玫瑰，因为不符合内容规范。再联系到此前ChatGPT拒绝回答David Mayer是谁，总之OpenAI的内容过滤真是令人困惑。

2️⃣全球首次！2B复现DeepSeek-R1「啊哈时刻」，UCLA等用纯RL实现多模态推理

新智元｜阅读原文

就在刚刚，我们在未经监督微调的2B模型上，见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」！这一成就，再次让AI社区轰动。「啊哈时刻」指大模型能够自发构建推理策略，重新审视自己的初始方法，来提升自己的推理能力。

UCLA等机构的研究者发现，虽然目前已经涌现出许多试图复现DeepSeek-R1的研究，然而这些研究大多遭遇了这个难点：很难复现出R1所表现出的回答长度增加和思考模式。幸运的是，他们成功了！如同DeepSeek-R1论文所描述的那样，多模态的「啊哈时刻」出现了——模型回答中涌现出了自我反思能力。他们不仅成为全球首个成功在多模态推理中产生了「啊哈时刻」涌现现象和回答长度增加的团队，而且仅仅使用了一个未经监督微调的2B模型。

具体来说，研究者从从Qwen2-VL-2B基础模型开始，直接在SAT数据集上进行强化学习。没有任何SFT的情况下，模型就在CVBench上达到了59.47%的准确率，比基础模型高出约30%，比经过SFT的模型高出约2%。甚至，这个模型大幅超越了指令微调模型，而后者的训练数据明显更多。现在，研究者已经在GitHub上开源了训练代码和关于回答长度的发研究发现，希望能加速AI社区未来对多模态推理的研究。

3️⃣对话像素绽放赵充：一年内用户超千万且挣到钱，AiPPT.cn是怎么做的

Founder Park｜阅读原文

国内的 AI 办公产品，AiPPT.com 绝对是最不可忽视的一个。产品上线后 4 个月，月活跃用户数便突破了百万大关，2025 年 2 月，AiPPT.com 的全球单月访问量逼近 1400 万，全球排名第 2。

对此，你怎么看？

在帖子下积极互动，则有机会获得相关蚂蚁周边和积分！

AI 内容库

欢迎你的投稿！

扫描下方二维码加入群聊，带走蚂蚁周边！

...全文

84 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

3月25日AI日报涵盖多则资讯。DeepSeek V3升级为V3 - 0324，实测表现出色，编程能力获好评，还在难题测试中有独特表现；AI大神Karpathy用400行AI代码实现氛围编程，让普通人也能开发应用；腾讯、英伟达推出采用Mamba - Transformer混合架构的模型，该架构价值值得探索。

3月11日AI日报涵盖多方面进展。DeepSeek引发多行业接入热潮，高通在终端AI领域布局领先；MCP协议简化AI模型交互，推动智能体发展；二次元AI新玩具“狸谱”App破圈走红，正从二次元向多品类泛化。

3月26日AI日报涵盖多方面内容。阿里开源Qwen2.5-VL-32B-Instruct多模态模型，可本地运行，性能出色。科研人员常用AI工具如o3 - mini、OpenAI、Llama、Claude 3.5 Sonnet、Olmo 2各有优势。Steam上AI驱动游戏增多，在派对、恋爱模拟等多品类有创新应用。

3月24日AI日报涵盖多则资讯。蚂蚁、华为、阿里云联手发布“大模型一体机”全栈解决方案，助力AI医疗落地，蚂蚁完成“三端一体”战略布局；奥特曼称OpenAI将首推AGI；OpenAI发布3个全新语音模型，包括2个STT和1个TTS模型，并提供API接入方式。

支付宝开发者社区

7

社区成员

33

社区内容

发帖

与我相关

我的任务

agi 企业社区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章