KAG:当知识图谱遇上大模型,专业领域问答的强力引擎

故事没有后来 2025-12-14 13:59:02

最近,检索增强生成(RAG)技术迅速崛起,成为让大模型获取领域知识、减少“幻觉”的主流方案。但在面对法律、医疗、政务等专业领域时,单纯基于向量相似度的检索往往显得“力不从心”——它难以捕捉知识之间的逻辑关联、数值关系与专家规则,导致生成的答案缺乏严谨性与专业性。

为了解决这一问题,蚂蚁集团知识图谱团队与浙江大学合作,提出了一种全新的专业领域知识服务框架——知识增强生成(Knowledge Augmented Generation, KAG)。KAG 并非简单地将图谱结构融入检索流程,而是深度融合知识图谱的符号推理能力与大模型的语义理解能力,构建了一个双向增强、逻辑严谨、可解释性强的新一代问答系统。

论文标题:KAG: Boosting LLMs in Professional Domains via Knowledge Augmented Generation
论文链接:https://arxiv.org/abs/2409.13731
开源代码:https://github.com/OpenSPG/KAG


一、为什么现有的 RAG 还不够?

传统 RAG 的核心是通过向量检索找到与问题相似的文本片段,然后交给大模型生成答案。这种方式存在两个根本瓶颈:

  1. 语义对齐弱:向量相似度不等于逻辑相关性。例如,“蔬菜或水果”和“蔬菜和水果”的向量可能很接近,但逻辑含义截然不同。
  2. 缺乏逻辑与数值推理:对于需要跨段落推理、时序判断、数值计算的专业问题(如“某地爆发过多少次瘟疫?”),纯文本检索难以保证答案的准确性与连贯性。

知识图谱(KG)以其显式的语义关系和强大的符号推理能力,恰好能补足这些短板。但传统 KG 构建成本高、覆盖面有限,且与大模型的结合往往停留在“检索后拼接”层面,未能实现深度融合。


二、KAG 的核心设计:五大创新模块

KAG 框架包含三个主要部分:KAG-Builder(离线构建)、KAG-Solver(在线求解)和 KAG-Model(模型增强),并通过以下五个关键技术实现突破:

1. LLM 友好的知识表示(LLMFriSPG)

为了让知识既适合机器推理又便于大模型理解,KAG 提出了 LLMFriSPG 知识表示框架。它将知识分为三个层次:

  • 知识层:经过模式约束、人工校验的高质量领域知识,逻辑严谨。
  • 信息层:通过信息抽取从文本中提取的实体、关系、事件,覆盖面广。
  • 原始文本块层:经过语义分块的原文,提供可追溯的上下文。

图1:KAG 整体框架,包含 KAG-Builder、KAG-Solver 和 KAG-Model。

img

这种分层设计既保证了知识的准确性,又通过“支持块”索引实现了图谱与原文的互相关联,为后续的混合检索与推理奠定了基础。

2. 知识结构-文本块互索引

KAG 在构建阶段就建立了图谱节点与文本块之间的双向索引。每个实体、事件都会关联到原文中出现的所有文本块,反之每个文本块也会指向其中出现的知识节点。这种结构不仅增强了知识的可解释性,也为后续的图引导检索提供了可能。

3. 逻辑形式引导的混合推理引擎

这是 KAG 的“大脑”。它定义了一套逻辑形式语言,将自然语言问题转化为包含检索、排序、计算、推理等多个步骤的可执行计划。

例如,对于问题:“C罗在 2011 年效力的球队中,哪一支成立时间最晚?”,逻辑形式可以分解为:

  1. 检索 C罗在 2011 年效力的球队;

  2. 检索这些球队的成立年份;

  3. 按成立年份排序,取最晚的一支。

    图2:LLMFriSPG 知识表示框架。

img

4. 基于语义推理的知识对齐

为了提升知识的连贯性与检索准确性,KAG 在构建与检索阶段都引入了语义关系推理,如同义、上下位、包含、因果等关系。例如,“白内障患者”可对齐到“视障人士”,即使用户未明确提及后者,系统也能通过语义关联找到相关文档。

5. KAG 模型增强

KAG 还对底层大模型进行了针对性增强,通过指令微调提升其在自然语言理解、推理与生成三个核心任务上的表现。实验显示,经过 KAG 微调的模型在多项理解与推理基准上均有显著提升。


三、实验结果:显著优于现有方法

论文在三个经典的多跳问答数据集上进行了测试:

  • HotpotQA
  • 2WikiMultiHopQA
  • MuSiQue

与当前最强的 RAG 方法 HippoRAG 相比,KAG 在 F1 分数上分别提升了 **19.6%、33.5% 和 12.5%**,检索召回率也有显著提高。

表1:KAG 在多项指标上显著优于现有方法(对应论文表8)。

img

消融实验进一步验证了各个模块的有效性:知识对齐增强明显提升了图谱的连通性与检索效果;逻辑形式推理在保证答案准确性的同时,也大幅提升了复杂问题的求解能力。

图3:知识与信息的分层表示。

img


四、落地场景:从政务到医疗

KAG 已在蚂蚁集团的实际业务中落地,覆盖政务与健康两大领域:

📍 政务问答

基于 1.1 万份政务服务文档,KAG 能够准确回答用户关于办事流程、所需材料、办理地点等问题。通过语义关联,系统还能识别同义事项(如“社保卡换领”与“社保卡挂失补办”),提升召回率。实验显示,KAG 在政务问答中的准确率达 **91.6%**,显著高于传统 RAG。

🏥 健康问答

在医疗场景中,KAG 依托高质量的医疗知识图谱,支持疾病科普、指标解读、医保政策查询等任务。系统还能触发预定义的医学规则(如血压分级判断),实现精准的指标推理与解释。在真实线上问答测试中,KAG 在科普类意图的准确率超过 **94%**,指标解读准确率超过 **93%**。


五、未来展望与开源计划

KAG 目前已在开源知识图谱引擎 OpenSPG 中原生支持,开发者可基于该框架快速构建专业领域的知识服务系统。未来,团队将继续优化知识提取与对齐技术、提升复杂问题规划能力,并探索基于 OneGraph 的大规模知识融合。

无论是构建严谨的知识决策系统,还是便捷的信息检索服务,KAG 都提供了一个融合符号与神经、兼顾准确性与覆盖度的新一代框架。


结语

在专业领域智能化服务的道路上,单纯依赖大模型或传统知识图谱都显得捉襟见肘。KAG 通过知识增强生成的设计理念,真正实现了 LLM 与 KG 的双向赋能:知识图谱为大模型提供精准、可推理的符号知识,大模型则为知识图谱提供语义理解与灵活生成能力。

这种“神经 + 符号”的融合,或许正是下一代专业 AI 系统的正确打开方式。

...全文
284 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

109

社区成员

发帖
与我相关
我的任务
社区描述
本社区由重庆大学与云从科技联合发起并共同运营,旨在打造一个开放、前沿、务实的知识共享与交流平台。 我们聚焦于两大前沿技术领域:通用语言大模型 (LLM)与知识协同技术。
软件工程 个人社区 重庆·沙坪坝区
社区管理员
  • 阿大abcd
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧