内部外部知识协同:高效自适应搜索代理新突破

重大阿大 2025-06-04 12:14:15

📚 论文标题:Reinforced Internal-External Knowledge Synergistic Reasoning for Efficient Adaptive Search Agent

🔗 Arxiv ID:2505.07596

🔑 关键词:retrieval-augmented generation, reinforcement learning, Large Language Models, knowledge synergy, IKEA

📖 太长不看版:该论文提出IKEA模型,通过强化学习和知识边界感知,有效减少LLMs中的幻觉,提升知识利用效率和推理速度。

📝 摘要翻译:检索增强生成(RAG)是减少大型语言模型(LLM)幻觉的常见策略。虽然强化学习(RL)可以使LLM通过激活检索能力充当搜索代理,但现有的方法往往未充分利用其内部知识。这可能导致冗余检索、潜在的有害知识冲突以及增加推理延迟。为了解决这些限制,迫切需要一种高效且自适应的搜索代理,能够辨别最佳的检索时机,并协同整合参数(内部)和检索(外部)知识。本文介绍了强化内部-外部知识协同推理代理(IKEA),它能够识别自身的知识边界,并优先利用内部知识,仅在认为内部知识不足时才求助于外部搜索。这是通过一种新颖的知识边界感知奖励函数和知识边界感知训练数据集实现的。这些是为面向内部-外部知识协同的RL设计的,激励模型提供准确的答案,最小化不必要的检索,并在自身知识不足时鼓励适当的外部搜索。在多个知识推理任务上的评估表明,IKEA显著优于基线方法,显著降低了检索频率,并展现出强大的泛化能力。

 

...全文
9 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

50

社区成员

发帖
与我相关
我的任务
社区描述
本社区由重庆大学与云从科技联合发起并共同运营,旨在打造一个开放、前沿、务实的知识共享与交流平台。 我们聚焦于两大前沿技术领域:通用语言大模型 (LLM)与知识协同技术。
软件工程 个人社区 重庆·沙坪坝区
社区管理员
  • 重大阿大
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧