事件检测与分类任务,包含两个步骤的子任务:识别事件触发词和将其分类为正确的事件类型。在这项任务中首要关键的就是触发词的识别,利用基于神经网络的模型来识别句子中的触发词是这些年的主流方法。然而,当涉及到由语义结构不清和语义相近的字符和词组组成的句子时,识别事件的触发词变得有些困难。本文提出一个融合字与词信息,再通过原型网络来精确事件分类的模型:输入融合字与词的信息的嵌入信息,将各个组成的嵌入信息投影到一个高维的特征空间中,对于每个维度类型的样本信息提取他们的均值作为聚类中心即原型,使用欧几里得距离作为距离度量,训练使得测试样本到自己类别原型的距离越近越好,到其他类别原型的距离越远越好,更精确地识别出句子所包含的触发词,分辨出事件类型。
事件检测(Event detection)的目标是检测文本中是否含有事件并对其进行分类。这项工作处理事件检测的任务,其目标是检测预定义事件的发生并对它们进行分类。例如,考虑下面这句话“在巴格达,美国坦克向巴勒斯坦饭店开枪时,一名摄影师丧生。”理想的事件检测系统应该识别两个事件,攻击事件和死亡事件(假设死亡和攻击都在预定义的事件集中)。
在事件检测阶段,触发字无法识别的问题会严重影响事件检测系统的性能。因为在中文中有一些词的含义是处于单字和单词中不一样的, 触发器可能是一个单词或者一个单词的特定部分或包含多个单词。
在这种情况下,基于单词的方法无法正确定位触发器,从而成为任务的严重限制。有一些基于特征的方法[1] [2] [3]被提出来缓解了这个问题,但是这些方法极大程度上依赖于人工标记。针对这一问题,相关人员提出了Nugget Proposal Networks [4], 该网络通过直接提出以每个字符为中心的整个触发器块来解释字触发器不匹配问题,而不用考虑字边界。然而,该网络的机制将候选触发器的范围限制在一个固定大小的窗口内,这是有些刻板的,并且存在触发器重复的问题。
该文章提出一种用于进行小样本分类任务的原型网络(Prototypical Network),其认为存在一种嵌入的表示方式,使得每一种类别对应的特征点都聚集在一个单独的原型表示附近。该文章为小样本和零样本设置建立了原型网络基于这一想法,作者采用了一种类似于聚类的方式,实现小样本分类任务。首先, 作者采用一种简单的四级神经网络结构将输入的信息映射到高维的特征空间(度量空间),由于引入了ReLU 激活函数因此该映射是非线性的。然后对于每一个类别,取其高维特征向量的均值作为原型