基于卷积神经网络的时序知识图谱补全研究

发布日期:2023年10月23日
基于卷积神经网络的时序知识图谱补全研究 基于卷积神经网络的时序知识图谱补全研究 基于卷积神经网络的时序知识图谱补全研究

本内容试读结束

下载后可阅读完整内容,立即下载

基于卷积神经网络的时序知识图谱补全研究

知识图谱通常由三元组头尾实体及关系组成,通过将大量三元组组织成图的形式,知识图谱可以展示实体间的复杂关系网络,这些关系可以是直接或间接的关联。传统的知识图谱中实体和关系之间的连接通常是静态的,缺乏对动态关系的建模能力,而时序知识图谱则是在三元组的基础之上增加了时间戳这一维度,能够更好地捕捉实体和关系的时序依赖性,从而支持时序推理,使得知识图谱的表达更加贴近于真实世界。但是通常包含时间信息的数据集中存在大量缺失数据,导致包含时间戳在内的四元组完整性下降,知识图谱下游应用如问答系统、推荐系统等将会受到直接影响。因此,本文提出了基于静态知识图谱嵌入模型ConvE的面向时序知识图谱补全的张量分解模型Conv-ATG (Convolutional Attention Temporal Graph),具体来说,ConvE主要针对静态知识图嵌入,基于ConvE引入了对于时间信息的表示并增加自注意力机制提高模型性能。在2个主流大规模数据集ICEWS、WIKIDATA上进行实验,实验结果表明Conv-ATG模型的性能优于现有的大多数推理方法,说明了本模型的有效性。

世界上每时每刻都充斥着大量的信息,这些信息包括了客观存在并且以人类的时间尺度来看是静止不变的,比如地球围绕着太阳旋转,天空是蓝色的等等。还包括了随着人类的进化和创造而后来产生的新信息,比如中国位于亚洲、拜登担任美国总统、甚至可以是小明和小红是好朋友这种非常贴近生活的琐碎信息。在计算机领域,信息的存储与结构组织是一个重要的领域,对于如何组织并管理真实世界里如此庞大数量的信息,知识图谱作为一种解决方案出现了。传统知识图谱(Knowledge Graph)以三元组的形式存储大量的结构化事实信息,每个三元组(es, r, eo)由头实体es、尾实体eo、关系r 三部分组成,用来表示现实世界中的物体或抽象概念之间的联系[1]。

传统知识图谱仅能表示静态不由随时间改变的信息,比如(太阳,位于,银河系),但是现实世界中大部分的信息是受到时间因素影响的, 比如(美国, 是总统, 特朗普)这个信息只在2017 年到2021 年之间成立,而在这个时间段之前或之后的时间上,这个信息显然是错误的。时序知识图谱通过增加时间信息, 将三元组扩充到四元组的方式解决了这个问题,使得信息随着时间可以进行变化,以达到更加接近真实世界信息的目的。依赖于时序知识图谱这种结构化的数据,很多下游应用得以发展,比如推荐系统、问答系统等等,但这不是本文的主要内容因此不再赘述。时序知识图存在大量的数据,但因为其大多都由人工、半自动方式创建和组织,通常存在着严重的数据不完备、数据稀疏的问题,很难对其进行直接使用,在这种情况下,对知识图谱的补全显得非常重要。目前知识图谱补全的主流方式为实体关系进行低维嵌入后进行评分,得分越高补全后的三元组为真实事实的可能性越大。



相关标签