基于深度学习的多元文本情感研究与分析

发布日期:2018年5月23日
基于深度学习的多元文本情感研究与分析 基于深度学习的多元文本情感研究与分析

本内容试读结束

下载后可阅读完整内容,立即下载

文本情感分析主要是通过文本挖掘技术对带有倾向性的文本进行情感分析和处理,识别其中主观性文本文章引用: 陈楠, 陈进才, 卢萍. 基于深度学习的多元文本情感研究与分析[J]. 计算机科学与应用, 2018, 8(5): 669-686.

随着移动互联网和大数据时代的到来,爆炸式的海量信息急需要我们去处理分析,基于文本的情感分析技术也越来越成为研究热点,作为互联网的主体,每一条文本都带着我们的主观情绪、每种情绪也是各不相同的,比如喜爱,愤怒,悲伤,难受,赞扬,中立等。情感分析又称作情感挖掘或者意见挖掘, 它主要包含的研究内容是情感信息分类任务、情感信息抽取任务等,传统的情感分析方法主要包括基于机器学习算法的研究和基于情感词典的构建的研究,基于情感词典的情感分析方法存在覆盖率不足的缺点,基于机器学习算法研究的情感分析会存在特征选择困难,人工标注训练集困难,模型简单,系统可扩展性不足,准确率低等缺点。

为了定量地得到文本内容的情感倾向, 避免情感二元极性划分带来的情感不充分的, 不全面的问题, 本文构建了针对多元情感分析的语义情感数据集,结合Co-Training 标注方法,减少了单纯进行人工标注带来的误差,增强了模型数据的健壮性和泛化能力,为了更加有效地结合文本的情感信息,抽取更加深层次的语义情感信息, 本文构建了更加有效的情感词向量模型算法, 将情感词典和情感词频-逆文档概率, 情感词向量三者有效地结合起来, 充分地考虑到了三者的优点, 提出了结合情感词向量和情感词典的D & W 词向量、结合情感词向量和情感词频的T & W 词向量、结合情感词频和情感词典以及情感词向量的SSW 情感语义词向量,并且将其应用在深度学习模型的词向量特征表示上面,进行模块叠加训练,实验证明对比基准词向量模型,其能够在文本情感分类任务中取得更加优秀的效果。

2. 相关研究 2.1. 深度学习 近些年, 深度学习在语音识别、自然语言处理、机器视觉、图像处理等领域取得了巨大成功, 在1986年,Hinton [1]提出了非常著名且沿用至今的反向传播算法,使得基于深度神经网络的深度学习(Deep Learning)的方法应运而生,从此神经网络变得非常流行起来,利用神经网络来建立语言模型的研究思路逐渐走向成熟,大大提升了文本的特征质量。2003 年,Bengio 等提出用神经网络的方法去构建二元语言模型[2]。2008 年,Ronan Collobert 和Jason Weston 推出SENNA 系统[3],并将其应用到自然语言处理领域中, 利用词向量的方法完成了其中的词性标注、命名实体识别、短语识别、语义角色标注等多种任务。



相关标签