:文本情感倾向性研究是人工智能的分支学科,涉及了计算语言学,数据挖掘,自然语言处理等多个学科。基于语义的情感倾向研究和基于机器学习的情感倾向研究是情感倾向性分析的两个方向。本文采用了基于语义的方法,利用HowNet 提供的情感词词典来进行文本的语义分析,对文本短语或词逐一赋予一个情感值,然后用语义和义元相似度计算的方法,计算文本中词语的语义相似度,得到词语的情感极性和强度,从而对文本的情感倾向给出一个量化的倾向程度值。通过实验表明这种方法文本研判的正确率较高。
传统的文本倾向性分析(Sentiment Classification)就是用户对某个事物看法或评论进行文本的分析,从而得到该看法或者评论是属于对该事物消极的还是积极意见。关于文本倾向性分析的研究近年来得到了长足的发展,它是数据挖掘中研究的热点,涉及自然语言的处理,信息检索,数据挖掘,计算语言学等领 域。基于语义的倾向判别为文本过滤、自动文摘等研究工作提供了新的思路和新的手段。我们可以对语义倾向度量值设定一个合适的阈值,对于倾向值低于或高于阈值,也就是态度倾向过于偏激的文章进行过滤操作,或者可将倾向值赋予一定的权值,作为文本过滤中需要考虑的一个因素。文本的倾向性分析主要由完成以下几个任务:1) 找出文档中能够体现情感的词或短语;2) 判断所找出的词或倾向值的极性和强度;3) 找出所抽取词的或短语与主题的关系。
*资助信息:本文由国家林业局国际竹藤网络中心科研专项项目1632009006 资助。
Copyright © 2012 Hanspub 282