基于用户属性与评分相似因子的推荐算法研究

发布日期:2018年1月19日
基于用户属性与评分相似因子的推荐算法研究 基于用户属性与评分相似因子的推荐算法研究

本内容试读结束

下载后可阅读完整内容,立即下载

为了使用户接收更准确和更加个性化的推荐信息,改善当前推荐系统因为数据稀疏、冷启动问题带来的

随着WEB2.0 的到来,互联网信息呈现井喷式增长并成为一个海量的信息空间,这些信息远超用户接受范围,使用户迷失在这些杂乱的信息中。用户需要的信息无法被快速有效地找到,这就是所谓的网络信息超载(Information Over-load)问题,为解决这些信息超载问题,帮助用户快速准确地找到自己想要的东西,推荐系统(Recommendation System, RS)应运而生。推荐系统通过分析用户的过往信息记录,然后主动地把用户在未来可能需要的信息(用户喜欢的电影、商品、新闻等)推荐出来。推荐系统的核心在于研究推荐算法[1]上,根据推荐算法的不同,目前个性化推荐系统分为协同过滤(Collaborative Filtering, CF)推荐系统、基于内容(Content-based)的推荐系统、基于规则(Rule-based)的推荐系统[2] [3]。其中应用最广泛、最成功的当属协同过滤推荐系统,而协同过滤算法又主要分为:基于内存的协同过滤算法(memory-based CF)、基于模型的协同过滤算法(model-based CF) [4] [5]。而相似度计算是推荐系统的根本所在,比较常见的相似度计算方法有:余弦相似性(cosine)、皮尔逊相关系数(Pearson correlation)、修正的余弦相似性(adjusted cosine)、Jaccard 相似度(Jaccard) [6] [7] [8],在相似度计算后选取相似邻居进行评分预测,最后经top-n 推荐[9],得出最终的推荐列表。

虽然推荐系统得到了广泛的应用,但也面临着很多问题。随着互联网用户与项目的增多,当用户或者项目的评分矩阵极度稀疏甚至未评分,或者当用户在一个新领域中没有任何过往记录时,如何将当前领域用户需要的信息推荐给他,如果不能够很快速地给一个新用户推荐其感兴趣的信息,那么用户可能会认为该领域的信息对他没有价值,这样可能导致用户不再使用该推荐系统,就出现了推荐系统中的冷启动问题[10] [11] [12] [13] [14]。所以针对这一问题,本文提出了基于用户基本属性与评分相似因子相结合的冷启动推荐算法。

2. 本文算法 本文利用对用户基本属性的相似度与评分相似因子相结合的方法,以此来挑选更合适的相似邻居。

()()()(), , 1, AttrScoreSim u vSimu vSimu vλλ=+− (1) (), AttrSimu v 为用户基本属性的相似度, (), ScoreSimu v 为用户评分的相似度;λ 为用户的基本属性在相似度计算中所占的权重比例,()1λ−为用户对项目的评价占整个相似度计算的权重比例。

对于新用户的冷启动问题,在新用户完全未评价任何项目前,需要把用户基本属性的相似度权重调到1。而考虑到随着新用户对项目评分的增多,应该加大对于评分相似性的重视程度,削减属性对于最终相似度的不利影响,以便用户相似度计算的重点由用户属性逐渐转移到用户评分上面,并且要保证这



相关标签