新作，请大家pp

michael_chao 2002-12-02 11:24:23

新站点，请大家多提宝贵意见！！

中实文业 http://www.chinareal.com.cn

...全文

30 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

LoneHome 2002-12-02

打赏
举报

回复

很多连接显示服务器忙呀。总体不错。

深度学习自然语言处理分享整理：pp摘要：我们提出了一种方法，通过在token level交错使用多个大语言模型（LLM），让它们学会协作。我们将由哪个 LLM 生成下一个token的决定建模为一个潜变量。通过在我们的潜变量模型下优化训练集的边际可能性，base LLM 会自动学习何时自行生成，何时调用其中一个 "辅助 "语言模型生成，所有这一切都无需直接监督。解码过程中的token level协...

深度学习自然语言处理分享整理：pp摘要：之前的研究发现，使用不同随机种子进行微调的预训练语言模型（LMs）可以获得相似的域内性能，但在句法泛化测试中的泛化效果却大相径庭。在这项研究中，我们发现即使在一个模型中，我们也能找到多个子网络，它们在域内in-domain的表现相似，但泛化效果out-of-domain却大相径庭。为了更好地理解这些现象，我们研究了是否可以从 "competing subn...

深度学习自然语言处理分享整理：pp摘要：联合嵌入预测架构Joint-Embedding Predictive Architecture（JEPA）是一种很有前途的自监督方法，它通过利用世界模型进行学习。虽然以前仅限于预测输入中的缺失部分，但我们探索了如何将 JEPA 预测任务推广到更广泛的损坏数据集。我们引入了图像世界模型Image World Models （IWM），这是一种超越遮蔽图像建模...

深度学习自然语言处理分享整理：pp摘要：大语言模型的预训练数据由多个领域（如网络文本、学术论文、代码）组成，其混合比例对结果模型的能力有着至关重要的影响。现有的研究依靠启发式方法或定性策略来调整比例，而我们发现了模型性能的定量可预测性，即函数形式的混合比例，我们称之为数据混合定律。在实际运行之前，在样本混合物上拟合这些函数可以揭示模型在未见混合上的性能，从而指导选择理想的数据混合。此外，我们还提...

深度学习自然语言处理分享整理：pp摘要：探索agent是否可以在不依赖于人工标记数据的情况下与其环境保持一致，提出了一个有意思的研究课题。从智能生物观察到的对齐过程中汲取灵感，我们提出了一种新颖的学习框架。agent能够熟练地从过去的经验中提炼出见解，完善和更新现有的笔记，以增强它们在环境中的表现。整个过程发生在内存组件中，并通过自然语言实现，因此我们将这个框架描述为内存学习(In-Memory...

图象工具使用

1,451

社区成员

24,335

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章