基于主题模型的热点新闻推荐算法研究

发布日期:2019年10月8日
基于主题模型的热点新闻推荐算法研究 基于主题模型的热点新闻推荐算法研究

本内容试读结束

下载后可阅读完整内容,立即下载

在互联网高速发展的今天,网络新闻已成为人们获得信息的主要途径,如何准确地为用户提供个性化的新闻推荐已成为业内人士日益关注的问题。为解决这一问题,出现了很多基于LDA的新闻推荐,但它们只进行新闻内容的分析,没有考虑用户兴趣的变化。针对此问题,本文提出了一种基于主题兴趣变化的热点新闻推荐算法。首先,用固定时间窗大小划分用户的阅读历史,并在每个阶段根据用户的阅读历史,利用LDA得到用户兴趣的概率分布。其次,利用时间惩罚加权函数和用户在每个阶段的新闻主题分布预测用户下一阶段的可能兴趣。最后,根据用户兴趣概率分布利用基于用户的协同过滤和待推荐新闻的主题分布完成热点新闻推荐。通过实际数据集上的实验表明,该方法提高了推荐的性能。

随着互联网的快速发展, 人们了解资讯的方式和阅读的习惯都发生了很大的变化, 网络新闻阅读已经成为人民日常生活不可缺少的一部分。它给人民生活带来便利,但同时由于参与用户多、资讯源头多也带来了严重资讯过载问题。如何从海量的新闻资讯或讨论话题中挖掘出用户感兴趣的内容变得越来越困难。个性化的热点新闻/话题推荐系统可以有效解决这一问题,为用户提供个性化热点新闻,提高用户的阅读和参与体验。如今日头条、一点资讯等新闻阅读产品都以自己的个性化推荐算法作为吸引用户的卖点。

个性化的热点新闻/话题推荐的关键是根据用户的阅读历史精准刻画用户的个性化阅读兴趣模型,从而为其推荐个性化阅读列表。因为新闻/话题和阅读的历史都具有一定的主题特性,因此很多学者将主题模型引入了新闻推荐过程。

郭晓慧[1]在LDA 模型的主题采样及其分布计算过程中引入平均加权值, 提高了主题间的区分度。汤鲲[2]等人将LDA 与GRU 相结合应用于群聊会话主题挖掘,解决了传统主题模型不能解决的词语顺序问题。曹巧翔[3]等人针对web 服务描述文本较短、缺乏足够有效信息的问题,提出了基于Word2Vec 和LDA 主题模型的web 聚类方法。居亚亚[4]等人在LDA 算法中加入了动态权重,使得在主题语义连贯性、文本分类准确率、泛化性能和精度方面比目前流行的LDA 推理算法表现得更加优越。

王丽苗[5]等人针对短视频喜好率预测面临着用户及广告的数量巨大且训练数据集高维、稀疏等问题, 提出了基于LDA-GBDT-FM 的短视频喜好率预测模型。

这些方法都注重了利用LDA 进行新闻内容的分析,提高了推荐的准确性,但却没有考虑用户兴趣的变化。因此本文提出了一种基于主题兴趣变化的热点新闻推荐算法,它利用用户阅读历史主题的变化描述用户兴趣的变化,从而预测用户下一时刻的可能的阅读兴趣。该方法首先以一定大小的时间窗划分用户的阅读,根据每个时间段内用户阅读历史利用LDA 模型,得到用户兴趣的主题分布。其次,利用时间惩罚加权函数和LDA 模型得到的用户在每个阶段的新闻主题分布,得到用户兴趣。最后利用基于用户的协同过滤和待推荐新闻的主题分布完成热点新闻推荐。通过实际数据集上的实验表明,该方法提高了推



相关标签