大数据时代如何从网络媒体发布的药品安全事件、药品安全监管及药品安全形势等医药新闻报道中跟踪药品安全舆情,是卫生部门和医药企业研判舆情的关键。本文利用八爪鱼采集器从某医药网获取2012年12月25日到2015年4月29日间9888条医药新闻,经数据清洗和人工识别选取了8类药品安全领域话题,共5667例实验数据。采用Hadoop平台和朴素贝叶斯分类算法实现药品安全话题跟踪。研究结果表明基于Hadoop平台的朴素贝叶斯分类算法的准确率较好、召回率较差、调和平均指标F1值为0.57时模型整体最佳。
近年来,与药品有关的事件越来越多,如毒胶囊、问题疫苗、假药等。这些药品事件的事实通过各种媒体报道在网络上飞速传开,引起了越来越多的人的了解和关注,产生了许多不良的舆论。药品安全事件与人们的身体健康密切相关。大众对此关注度高,容易产生消极的非理性情绪。此外,信息传播在时空上呈现出不断变化的复杂趋势[1],不好的情绪的叠加可能导致更严重的社会危机。有报告指出,近90%的药品安全舆情事件均未取得令人满意的效果[2],因此,迫切需要对大量的药品舆论信息进行处理并获得敏感信息,达到舆论信息的抓取、解析、观测、示警和跟踪。由于数据太大、信息不集中、数据结构不明显等特点,导致以前的服务器在处理数据上效果不理想,无法有效达到对药品安全舆论分类的目的。Hadoop 技术飞速的发展,提高了对大量数据进行处理的效率。为此,本文研究了基于Hadoop 的药物安全舆论主题跟踪模型和算法,实现了对药物安全舆论的快速分类,加快对舆论分类的能力,对以后的研究提供方向[3]。
2. 研究现状 刘晓欣[4]在我国药品舆情监管系统数据发掘技术的基础上,又通过采用文献法、基于大数据系统抓取相关数据和案例进行药品网络舆情研究,得出了药品网络舆情特点、对应的引导策略,对政府部门后续处理、媒体报道、企业发展等具有重要的研究意义的结论。
李艳业[5]借鉴危机传播和危机发展理论以及危机处理技术,整理出问题疫苗发展的四阶段,针对具有明显摩擦的对话研究其可能会爆发的时间和持续的时间进行了具体的研究,得出对完善和优化对危机事件传播管控的应对措施和建议:政府需要关注大众需求,对于危机做到良好的修复监管;各类媒体要控制好传播尺度,相辅相成,共同建立良好社会环境;涉医人员要担负起对社会的职责,传播科学的舆论进行引导;基层公众要提高媒体素养,共同抵制舆论的传播的结论。
刘能燕[6]将大数据的相关技术引入政府的舆情监管中,并且以我们国家相关部门采用大数据技术针对舆情进行管理的案例作研究,归纳其对舆情管理的途径,并对当今时代大数据在完善政府职能部门对