109
社区成员
发帖
与我相关
我的任务
分享当结构知识提示不再是黑箱,图表揭示了其真正的优势与短板。
大语言模型(LLM)的“幻觉”问题,就像一位知识渊博却时常记错细节的学者,限制了其在严肃场景下的应用。为了给这位学者配上可靠的“外部记忆”,研究者们引入了知识图谱,并发展出一种名为 结构知识提示(SKP) 的关键技术。
SKP如同一位专业的翻译官,它将知识图谱中非文本的结构化信息(如实体、关系网络),通过一个称为“适配器”的模块,转化为LLM能理解的提示,从而辅助其进行事实性生成。
SKP范式示意图

尽管SKP在诸多任务中表现卓越,但一个根本性问题始终笼罩在迷雾中:我们设计的这套方法,其能力边界究竟在哪里?它真的能泛化到各种不同的知识形态和任务上吗?
为了系统性地回答这个问题,一项来自浙江大学与蚂蚁集团的研究构建了一个全新的、多维度的评测基准——SUBARU。它的设计理念非常清晰:要像体检一样,从不同维度检验SKP的健康状况。
SUBARU的九宫格任务矩阵

如上图所示,SUBARU的评估体系极其全面。例如,“实体-描述”是最细粒度的考验,要求模型仅凭一个实体的结构嵌入就说出它的名字;而“子图-选择”则更注重关系推理,要求模型在一个小知识网络中找出缺失的核心。更重要的是,评测中刻意隐藏了文本线索,迫使模型必须依赖SKP输入来答题,从而纯粹地检验其知识传递效率。
研究者们用4种主流编码器和4种常见适配器,在SUBARU上进行了大规模实验。实验结果浓缩为一张详实的成绩单,并揭示了几个关键发现:
核心实验结果总表
SUBARU基准测试中9个任务的主要实验结果。我们为每个任务的前三位结果使用从浅到深的不同绿色颜色进行着色。

发现一:简单者胜出,复杂非必需
尽管追求复杂模型是常态,但上表清晰显示,简单的多层感知机(MLP) 在绝大多数任务中取得了最佳性能。反观Q-Former等复杂架构,表现并不稳定。这表明,在SKP中,适配器的核心任务可能是高效的“表征对齐”,而非复杂的特征变换。
发现二:擅长宏观推理,短板在微观识别
图表数据揭示了一个鲜明对比:SKP在三元组和子图级别的选择题上表现出色,但在最细粒度的实体描述任务上,所有模型的精确匹配率几乎为零。这说明,当前的SKP是一个优秀的“结构模式识别器”,能理解“人与人之间的职业关系”,却无法精准认出“张三”或“李四”本人。
发现三:任务间迁移困难,知识内泛化尚可
为了测试可迁移性,研究者进行了跨任务训练实验。结果如下图所示:
跨任务可迁移性柱状图

由图可见,跨任务训练带来的性能增益非常有限,表明当前SKP在任务间的泛化能力较弱。然而,在同一个任务内,面对训练中从未见过的新实体,SKP却展现出了不错的泛化能力(参见原文Figure 5),说明它较好地学会了通用的关系模式。
发现四:适配器深度有“甜蜜点”,范式本身具普适性
实验发现,MLP适配器的深度并非越深越好,3-4层通常达到性能峰值(原文Figure 6)。同时,该范式在LLaMA 2、LLaMA 3、Mistral等不同架构的LLM上都能有效工作,证明了其作为通用知识增强接口的潜力。
以上数据或许有些抽象,一个具体的案例能让我们看得更真切。在“子图描述”任务中,给定一个描述德国力学教授Franz Grashof生平结构的子图,SKP引导下的LLM生成了如下回答:
子图描述任务案例对比表

观察上表,即便是“好的预测”,也完全无法说出核心实体“Franz Grashof”的正确姓名,只能模糊地描述“一位德国工程师,在大学工作,使用德语”。这精准地刻画了SKP的能力边界:它能有效传递类别与关系等粗粒度知识,但无法精准锚定具体实例的细粒度事实。
这场系统的“体检”为我们指明了方向。当前SKP范式是为主流知识推理任务提供粗粒度结构支持的强大工具,但其细粒度、精准的事实感知能力仍是显著短板。
未来的研究不应盲目堆叠适配器复杂度,而应思考如何编码并传递更精确的实例信息,或如何将SKP与检索增强生成等技术更有机地融合,以构建真正可靠、通用的知识增强大模型。
本文解读基于以下研究论文:
Zhang, Y., Chen, Z., Guo, L., Xu, Y., Chen, S., Sun, M., ... & Chen, H. (2025). Have We Designed Generalizable Structural Knowledge Promptings? Systematic Evaluation and Rethinking. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (ACL 2025).
原文链接:https://github.com/zjukg/SUBARU (论文及相关资源)