新冠疫情催生了“宅经济”,袋装柳州螺蛳粉强势崛起,成为全国热销的方便食品之一。目前网购平台上开设的螺蛳粉网店高达1.2万家,在竞争如此激烈的情况下,挖掘大众的喜好变得尤为重要。本文拟采用
在国家高度重视创新, 大力支持创业背景下[1], 以广西柳州螺蛳粉为代表的方便食品产业迅速崛起。
有关数据显示, 2016 年柳州螺蛳粉年产值16 亿元;2017 年上升至30 亿元;2018 年上升至45 亿元;2019年全产业链产值突增至135 亿元,其中预包装螺蛳粉占比约为46%;因受新冠疫情影响,2020 年预包装螺蛳粉销量持续增长,截至2020 年10 月,柳州预包装螺蛳粉产值已超87 亿元。目前网购平台开设的螺蛳粉网店高达1.2 万家,在阿里巴巴米粉特产类销量排名第一。市场竞争日益激烈,如何满足大众的喜好变得尤为重要。面对众多口味及多种配料的螺蛳粉,我们利用多特征情感分析的方法从大量的螺蛳粉购买评论中挖掘出大众的喜好,同时挖掘出商品的不足,为商家改进商品提供有利参考。
近年来, 文本情感分析的研究成果越来越多。
例如, 王亚[2]从京东商城爬取了几种手机的评论数据, 对文本进行预处理后, 通过建立情感分类模型对其进行情感分析, 并提取出对商家改进产品有用的信息。
毕春光[3]等提出基于评论特征词构建评论分类模型以及基于朴素贝叶斯的特征情感分类器,从用户的评论出发,对人参的多个特征进行情感分析。Ghose [4]等利用构造的情感分类器对预处理后的文本进行情感分类,在用户进行购买时可以起到参考作用。杨鑫[5]等通过基于领域词典的分析法对贵阳名宿评论数据进行情感分析,同时利用LDA 主题挖掘,分析民宿评论中正负面情感主题并分析其原因,为民宿管理者做出相应决策提供理论性依据。周欢[6]等通过对评论文本进行词频分析和LDA 主题模型分析来对商品的物流服务质量进行研究,并对商家或企业提出相关建议。张公让[7]等利用情感分析方法挖掘出影响客户服务评价和满意度的关键因素,为客户情感关键影响因素识别提供数学科学的研究范式。
2. 螺蛳粉购买评论的特征分析 特征分析是通过对评论文本进行分析,从大量的评论文本中分析出用户重点关注的特征,从而对这些关注度高的特征进行情感分析。本文采用TextRank 算法、词云图的特征可视化、LDA 主题特征分析三种特征分析方法找出用户对商品特征关注度的分布情况,对关注度高的商品特征进行情感分析研究。
2.1. 数据准备 利用八爪鱼软件爬取了京东商城上客户对螺蛳粉的评论,并选取了国内排名前八的螺蛳粉品牌,包括好欢螺、李子柒、螺霸王等,爬取的评论总数为20,640 条。通过对原始评论数据进行去除重复评论、