1.2.3 知识图谱涉及的技术领域

如图1-5所示,对知识图谱应用的研究融合了自然语言处理(NLP)、图论及数据库等领域的技术,是一个交叠的研究领域。学术界的研究主要关注知识图谱的自然语言特性,包括语义网、信息抽取、自然语言对话等。而在金融、公共安全、营销服务等产业的落地过程中,企业主要关注知识图谱的存储与计算、数据治理、数据管理等相关应用研究。在社交网络、电网、交通网络等领域,企业主要关注图论、图网络计算等相关应用研究。

图1-5

总体来讲,在不同的领域,知识图谱所涉及的技术都有所偏差,但核心目标都是提升其业务场景中知识沉淀、数据关联和推理分析的效率。

在业务实践中,知识图谱既可以从语义增强的角度提升自然语言理解任务的效果,又可以从图结构信息增强的角度提升模型对全局信息的利用率。因此,如何利用更多元的知识表示增强知识图谱的语义表达能力,以应对复杂多变的认知智能应用需求,已成为亟待解决的重要问题。

知识图谱的落地研究,应充分利用知识图谱所具有的符号学派特性、统计学派特性及图网络学派特性。

• 符号学派特性:指知识图谱可以存储符号的语义逻辑关联,比如用户社群运营规则、专家检修经验规则、财务审计经验规则等过程性知识。

• 统计学派特性:指知识图谱具有数据概念关联能力,即知识图谱可以定义数据之间的关联类型及权重。

• 图网络学派特性:指知识图谱具有复杂网络、图结构的信息存储和关联扩展能力。

在知识图谱的应用过程中,通常会基于业务场景的特性选择利用知识图谱的符号信息或者图拓扑结构信息,采用统计知识表示等方式生成特征并使用。如果需要进一步综合符号信息和图拓扑结构信息,则会面临数据空间不一致、关联难度高等挑战。目前,图神经网络(Graph Neural Networks,GNN)是最有希望解决知识图谱上述挑战的方法之一。