KAG：当知识图谱遇上大模型，专业领域问答的强力引擎

故事没有后来 2025-12-14 13:59:02

最近，检索增强生成（RAG）技术迅速崛起，成为让大模型获取领域知识、减少“幻觉”的主流方案。但在面对法律、医疗、政务等专业领域时，单纯基于向量相似度的检索往往显得“力不从心”——它难以捕捉知识之间的逻辑关联、数值关系与专家规则，导致生成的答案缺乏严谨性与专业性。

为了解决这一问题，蚂蚁集团知识图谱团队与浙江大学合作，提出了一种全新的专业领域知识服务框架——知识增强生成（Knowledge Augmented Generation, KAG）。KAG 并非简单地将图谱结构融入检索流程，而是深度融合知识图谱的符号推理能力与大模型的语义理解能力，构建了一个双向增强、逻辑严谨、可解释性强的新一代问答系统。

论文标题：KAG: Boosting LLMs in Professional Domains via Knowledge Augmented Generation
论文链接：https://arxiv.org/abs/2409.13731
开源代码：https://github.com/OpenSPG/KAG

一、为什么现有的 RAG 还不够？

传统 RAG 的核心是通过向量检索找到与问题相似的文本片段，然后交给大模型生成答案。这种方式存在两个根本瓶颈：

语义对齐弱：向量相似度不等于逻辑相关性。例如，“蔬菜或水果”和“蔬菜和水果”的向量可能很接近，但逻辑含义截然不同。
缺乏逻辑与数值推理：对于需要跨段落推理、时序判断、数值计算的专业问题（如“某地爆发过多少次瘟疫？”），纯文本检索难以保证答案的准确性与连贯性。

知识图谱（KG）以其显式的语义关系和强大的符号推理能力，恰好能补足这些短板。但传统 KG 构建成本高、覆盖面有限，且与大模型的结合往往停留在“检索后拼接”层面，未能实现深度融合。

二、KAG 的核心设计：五大创新模块

KAG 框架包含三个主要部分：KAG-Builder（离线构建）、KAG-Solver（在线求解）和 KAG-Model（模型增强），并通过以下五个关键技术实现突破：

1. LLM 友好的知识表示（LLMFriSPG）

为了让知识既适合机器推理又便于大模型理解，KAG 提出了 LLMFriSPG 知识表示框架。它将知识分为三个层次：

知识层：经过模式约束、人工校验的高质量领域知识，逻辑严谨。
信息层：通过信息抽取从文本中提取的实体、关系、事件，覆盖面广。
原始文本块层：经过语义分块的原文，提供可追溯的上下文。

图1：KAG 整体框架，包含 KAG-Builder、KAG-Solver 和 KAG-Model。

这种分层设计既保证了知识的准确性，又通过“支持块”索引实现了图谱与原文的互相关联，为后续的混合检索与推理奠定了基础。

2. 知识结构-文本块互索引

KAG 在构建阶段就建立了图谱节点与文本块之间的双向索引。每个实体、事件都会关联到原文中出现的所有文本块，反之每个文本块也会指向其中出现的知识节点。这种结构不仅增强了知识的可解释性，也为后续的图引导检索提供了可能。

3. 逻辑形式引导的混合推理引擎

这是 KAG 的“大脑”。它定义了一套逻辑形式语言，将自然语言问题转化为包含检索、排序、计算、推理等多个步骤的可执行计划。

例如，对于问题：“C罗在 2011 年效力的球队中，哪一支成立时间最晚？”，逻辑形式可以分解为：

检索 C罗在 2011 年效力的球队；
检索这些球队的成立年份；
按成立年份排序，取最晚的一支。

图2：LLMFriSPG 知识表示框架。

4. 基于语义推理的知识对齐

为了提升知识的连贯性与检索准确性，KAG 在构建与检索阶段都引入了语义关系推理，如同义、上下位、包含、因果等关系。例如，“白内障患者”可对齐到“视障人士”，即使用户未明确提及后者，系统也能通过语义关联找到相关文档。

5. KAG 模型增强

KAG 还对底层大模型进行了针对性增强，通过指令微调提升其在自然语言理解、推理与生成三个核心任务上的表现。实验显示，经过 KAG 微调的模型在多项理解与推理基准上均有显著提升。

三、实验结果：显著优于现有方法

论文在三个经典的多跳问答数据集上进行了测试：

HotpotQA
2WikiMultiHopQA
MuSiQue

与当前最强的 RAG 方法 HippoRAG 相比，KAG 在 F1 分数上分别提升了 **19.6%、33.5% 和 12.5%**，检索召回率也有显著提高。

表1：KAG 在多项指标上显著优于现有方法（对应论文表8)。

消融实验进一步验证了各个模块的有效性：知识对齐增强明显提升了图谱的连通性与检索效果；逻辑形式推理在保证答案准确性的同时，也大幅提升了复杂问题的求解能力。

图3：知识与信息的分层表示。

四、落地场景：从政务到医疗

KAG 已在蚂蚁集团的实际业务中落地，覆盖政务与健康两大领域：

📍 政务问答

基于 1.1 万份政务服务文档，KAG 能够准确回答用户关于办事流程、所需材料、办理地点等问题。通过语义关联，系统还能识别同义事项（如“社保卡换领”与“社保卡挂失补办”），提升召回率。实验显示，KAG 在政务问答中的准确率达 **91.6%**，显著高于传统 RAG。

🏥 健康问答

在医疗场景中，KAG 依托高质量的医疗知识图谱，支持疾病科普、指标解读、医保政策查询等任务。系统还能触发预定义的医学规则（如血压分级判断），实现精准的指标推理与解释。在真实线上问答测试中，KAG 在科普类意图的准确率超过 **94%**，指标解读准确率超过 **93%**。

五、未来展望与开源计划

KAG 目前已在开源知识图谱引擎 OpenSPG 中原生支持，开发者可基于该框架快速构建专业领域的知识服务系统。未来，团队将继续优化知识提取与对齐技术、提升复杂问题规划能力，并探索基于 OneGraph 的大规模知识融合。

无论是构建严谨的知识决策系统，还是便捷的信息检索服务，KAG 都提供了一个融合符号与神经、兼顾准确性与覆盖度的新一代框架。

结语

在专业领域智能化服务的道路上，单纯依赖大模型或传统知识图谱都显得捉襟见肘。KAG 通过知识增强生成的设计理念，真正实现了 LLM 与 KG 的双向赋能：知识图谱为大模型提供精准、可推理的符号知识，大模型则为知识图谱提供语义理解与灵活生成能力。

这种“神经 + 符号”的融合，或许正是下一代专业 AI 系统的正确打开方式。

...全文

284 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

KAG:大模型知识服务框架

KAG（Knowledge Augmented Generation）是一种专业领域知识服务框架，旨在解决检索增强生成（RAG）技术的局限性，如向量相似度与知识推理相关性之间的差距以及对知识逻辑的不敏感性。KAG通过结合知识图谱（KG）与向量检索的优势，从五个关键方面双向增强大语言模型（LLM）和KG：适合LLM的知识表示、知识图谱与原始文本块的互索引机制、逻辑形式指导的混合推理引擎、与语义推理对齐的知识以及KAG的模型能力提升。实验结果显示，KAG在多跳问答任务中显著优于现有RAG方法，并在蚂蚁集团的电子政务和电子健康问答任务中表现出色。KAG框架的开源支持将促进其在本地化开发中的应用，提升领域知识服务的准确性和效率。

本文探讨了从RAG（检索增强生成）到KAG（知识增强生成）的技术演进过程，分析了KAG框架如何解决传统RAG模型的不足，为垂直领域应用提供更精准高效的解决方案。文章详细介绍了大模型在实际应用中的痛点，如幻觉生成、知识滞后、效率瓶颈等，并提出了通过外挂知识库和结构化推理来提升模型能力的路径。KAG框架通过知识构建、问题求解和模型支撑三个部分，实现了知识自动化构建、分层知识表示和逻辑符号引导的结构化推理。此外，文章还介绍了KAG-Thinker的创新路径，通过逻辑形式统一推理模式，提升推理的可控性与可解释性。最后，文章提出了从RAG到KAG的四大跃迁路线，推动大模型从知识助手向智能伙伴的转变。

KAG框架（Knowledge Augmented Generation）是一种结合知识图谱与检索增强生成（RAG）技术的创新方法，旨在解决传统RAG在多跳任务和跨段落任务中的性能瓶颈。该框架通过整合知识图谱的语义类型、关系和知识图谱问答（KGQA），构建了KAG-Builder、KAG-Solver和KAG-Model三大核心模块。KAG-Builder负责构建离线索引，KAG-Solver引入混合推理引擎，KAG-Model则优化语言模型的特定能力。此外，KAG还提出了LLMFriSPG知识表示框架，通过知识层、信息层和原始块层的分层设计，增强了知识的准确性和逻辑严密性。实验表明，KAG框架在HotpotQA、2WikiMultiHopQA等数据集上的性能显著优于传统RAG方法，尤其在知识对齐和混合推理方面表现出色。

资源下载链接为： https://pan.quark.cn/s/a8aeddd60d40 (最新版、最全版本)KAG开源框架介绍及使用KAG实现知识增强生成应用(产品模式测试、开发者模式测试)，KAG是OpenSPG发布v0.5版本中推出的知识增强生成（KAG）的专业领域知识服务框架，旨在充分利用知识图谱和向量检索的优势，增强大型语言模型和知识图谱，以解决 RAG 挑战

通用语言大模型及知识协同技术

109

社区成员

81

社区内容

发帖

与我相关

我的任务

软件工程个人社区重庆·沙坪坝区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章