随着大数据时代的来临,人工智能快速发展,知识图谱已经在垂直搜索和智能问答等领域中发挥着重要的作用。但是,即使是全世界上最大的知识图谱也仍然不完整,所以知识推理一直是知识图谱的研究热点之一。本文提出了一个融合实体描述和关系图卷积神经网络(R-GCN)的模型(DR-GCN),并将其应用于知识推理中的标准任务:实体分类(Entity Classification),即缺失实体属性的恢复。R-GCN是根据图卷积神经网络(GCN),专门针对实际知识图谱的高度多元关系数据特征而开发的一类图卷积神经网络。本文研究的DR-GCN模型,该模型充分利用了知识图谱中的关系类型、关系方向、实体自循环、实体描述等信息进行实体分类。本文对DR-GCN模型进行了彻底的评估,并与已建立的基线进行了比较。实验表明,DR-GCN模型的实验结果比现有的基线有所提高,在AIFB和BGS数据集上,DR-GCN模型的准确率分别比基线中准确率最高的G-GAT和RDF2Vec模型的96.19%和87.24%高0.24%和0.35%,验证了改进后的模型效果更佳。
随着计算机科学的迅猛发展,大数据时代来临,互联网数据爆炸式的增长,这些数据中蕴含着大量有价值的信息,如何对其进行提取和表达引起了大量学者的关注。知识图谱作为一个能对其进行有效的表达和组织的工具应运而生。知识图谱这一概念,由2012 年Google 公司所提出,用于Google 浏览器的智能搜索引擎。自此以后,知识图谱得到了众多学者的关注和青睐,在许多领域得到了广泛的应用。然而,知识图谱大多都是由人工或半自动的方法构建,导致了知识图谱的不完整。据2014 年统计,世界上最大的知识库之一freebase, 存在着71%的人没有确切的出生日期, 75%的人没有国籍信息[1]。
知识图谱的不完整制约着其下游应用的发展,如何对现有的知识图谱进行补全,扩大其规模成为人们迫切需要解决的问题之一,因此知识推理成为了人们关注和研究的重点之一。
Schlichtkrull 等人[2]提出了关系图卷积神经网络模型(R-GCN)从微观上建模星形结构以建模知识图谱。R-GCN 网络将目标实体与知识图谱中的邻居实体进行卷积学习,输入当前实体的相邻关系信息,包括关系类型、关系的方向以及实体自循环的信息,输出目标实体的隐性特征向量表示,然后通过节点损失函数进行实体分类。该模型充分地利用了知识图谱的关系信息,却忽略了实体的简明描述中蕴含了丰富的语义信息。本文提出了结合实体描述和关系图卷积神经网络的模型(DR-GCN),并将其应用于知识推理的实体分类任务。实验结果表明,该模型有效地提高了实体分类的准确度,验证了该方法的有效性。