社区
图象工具使用
帖子详情
新作,请大家pp
michael_chao
2002-12-02 11:24:23
新站点,请大家多提宝贵意见!!
中实文业 http://www.chinareal.com.cn
...全文
30
1
打赏
收藏
新作,请大家pp
新站点,请大家多提宝贵意见!! 中实文业 http://www.chinareal.com.cn
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
LoneHome
2002-12-02
打赏
举报
回复
很多连接显示服务器忙呀。总体不错。
每日论文速递 | MIT
新作
:使用多个大模型协作decode
深度学习自然语言处理 分享整理:
pp
摘要:我们提出了一种方法,通过在token level交错使用多个大语言模型(LLM),让它们学会协作。我们将由哪个 LLM 生成下一个token的决定建模为一个潜变量。通过在我们的潜变量模型下优化训练集的边际可能性,base LLM 会自动学习何时自行生成,何时调用其中一个 "辅助 "语言模型生成,所有这一切都无需直接监督。解码过程中的token level协...
每日论文速递 | 陈丹琦
新作
:启发式核心-理解PLM子网络
深度学习自然语言处理 分享整理:
pp
摘要:之前的研究发现,使用不同随机种子进行微调的预训练语言模型(LMs)可以获得相似的域内性能,但在句法泛化测试中的泛化效果却大相径庭。在这项研究中,我们发现即使在一个模型中,我们也能找到多个子网络,它们在域内in-domain的表现相似,但泛化效果out-of-domain却大相径庭。为了更好地理解这些现象,我们研究了是否可以从 "competing subn...
每日论文速递 | LeCun
新作
:IWM图像世界模型
深度学习自然语言处理 分享整理:
pp
摘要:联合嵌入预测架构Joint-Embedding Predictive Architecture(JEPA)是一种很有前途的自监督方法,它通过利用世界模型进行学习。虽然以前仅限于预测输入中的缺失部分,但我们探索了如何将 JEPA 预测任务推广到更广泛的损坏数据集。我们引入了图像世界模型Image World Models (IWM),这是一种超越遮蔽图像建模...
每日论文速递 | 邱锡鹏团队
新作
:探索LLM预训练的Data Mixing Laws
深度学习自然语言处理 分享整理:
pp
摘要:大语言模型的预训练数据由多个领域(如网络文本、学术论文、代码)组成,其混合比例对结果模型的能力有着至关重要的影响。现有的研究依靠启发式方法或定性策略来调整比例,而我们发现了模型性能的定量可预测性,即函数形式的混合比例,我们称之为数据混合定律。在实际运行之前,在样本混合物上拟合这些函数可以揭示模型在未见混合上的性能,从而指导选择理想的数据混合。此外,我们还提...
每日论文速递 | 邱锡鹏团队
新作
:In-Memory Learning 智能体声明式学习
深度学习自然语言处理 分享整理:
pp
摘要:探索agent是否可以在不依赖于人工标记数据的情况下与其环境保持一致,提出了一个有意思的研究课题。从智能生物观察到的对齐过程中汲取灵感,我们提出了一种新颖的学习框架。agent能够熟练地从过去的经验中提炼出见解,完善和更新现有的笔记,以增强它们在环境中的表现。整个过程发生在内存组件中,并通过自然语言实现,因此我们将这个框架描述为内存学习(In-Memory...
图象工具使用
1,451
社区成员
24,335
社区内容
发帖
与我相关
我的任务
图象工具使用
多媒体/设计/Flash/Silverlight 开发 图象工具使用
复制链接
扫一扫
分享
社区描述
多媒体/设计/Flash/Silverlight 开发 图象工具使用
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章