网络事件的热度演化研究是舆情监测的基础,而现有的网络事件热度研究方法主要是采用文本处理的方 *通讯作者。
在当今信息时代的大背景下,网络事件的发生会导致民众的热烈关注,在事件发展周期里,民众的高度关注可以导致社会恐慌或对社会和谐构成负面影响,因此近年党和国家对网络舆情的研究与监管也开始高度重视。目前,国内外对于网络热点事件的研究主要集中于网络事件的应急管理和网络事件本身的客观规律两个方面,这些研究主要的关注点都是在单个事件的发生、发展和演化机理等[1] [2] [3]。然而在如今的信息爆炸时代网络事件舆论关联是普遍存在的,事件通过共同主体、主题或情绪等共性因素相互联系,可以认为具有相同或相似事件原型的多个事件可构成一个事件群,它们会因为相同或相似事件的发生而被强化和突出。
在网络事件主体关联中,事件的舆情演化由于明显或不明显、直接或间接的主体因素互相关联,例如陈世峰杀人事件、药家鑫事件、我爸是李刚事件的主体均为“富二代”、“官二代”,在事件的演化周期中,网民的舆论热点在某一时期不可避免的关注在富二代这一群体上面,则我们认为这些网络热点事件是相互关联的。在网络事件主题关联中,事件的舆情演化由于存在相同或相似的主题而产生联系, 比如天津港爆炸事故、日照石大化工爆炸、昆明爆炸案的主题均含有“爆炸”、“意外事故”等,则认为这些事件是存在关联的。这些具有关联的事件我们称为事件群,而事件群之间会产生相互影响。
基于上述思想,本文提出了一种基于差异度的网络事件群演化趋势建模方法。该方法将多个关联事件的热度演化图经平移缩放投影到同一时间轴空间中,加入事件的关联信息,不断更新矩阵中心,最小化目标函数以求找到差异度最小的事件群的热度演化曲线。实验证明该方法得出的事件群演化曲线更能反映各个事件统一的发展特性。
2. 相关研究 2.1. 事件演化相关研究 在事件演化分析研究方面,主要的关注点都是在单个事件的发生、发展和演化机理等,吕楠、罗军勇[2]等人提出一种基于多向量模型的事件演化分析算法, 该算法可以发现话题中各个事件间的演化关系, 解决了话题追踪技术不能对话题全局演化进行分析的问题;张辉、李国辉[3]等人为了更好的发现话题中事件的关系,利用事件的时间、内容、命名实体关系建立新的演化关系模型,并提出一种新的新闻事件演化建模方法,该方法可以准确检测事件演化并揭示事件发展的潜在关系;廖君华、孙克迎[4]等人结合LDA 主题模型和中文时间识别技术设计并实现了一个网络时序主题演化系统HTAS,该系统能够快速获