经典推荐算法研究综述

发布日期:2019年9月25日
经典推荐算法研究综述 经典推荐算法研究综述

本内容试读结束

下载后可阅读完整内容,立即下载

推荐系统作为一种有效的信息过滤工具,由于互联网的不断普及、个性化趋势和计算机用户习惯的改变,将变得更加流行。尽管现有的推荐系统也能成功地进行推荐,但它们仍然面临着冷启动、数据稀疏性和用户兴趣漂移等问题的挑战。本文概述了推荐系统的研究现状,对推荐算法进行了分类,介绍了几种经

随着信息技术迅速发展和在线服务的普及,人们能够快速获取大量信息,这也使得人们从信息匮乏的时代跨进了“信息过载”的时代。数据的“爆炸式”增长,为人类记忆和处理信息的能力带来了极大的挑战,大量冗余信息严重干扰对有用信息的提取和利用,增加信息处理的成本。个性化和智能化的代理、搜索引擎和推荐系统是被大家广泛使用的克服信息过载的主要工具或技术[1]。然而,与返回与用户查询匹配的相关结果的搜索引擎或检索系统不同,推荐系统根据用户的需求和偏好提供个性化的推荐。

推荐系统通过分析用户的特点、项目(被推荐物品或服务的统称)的特征、用户的历史行为、以及其他一些辅助信息,主动为用户推荐满足他们兴趣和需求的项目,属于主动式提供服务[2]。推荐系统不仅可以根据用户的偏好推荐与用户偏好相似的项目,甚至可以在没有用户偏好的情况下,帮助用户发现他们感兴趣的新内容。推荐系统作为解决信息过载的有效方法,已成为学术界和工业界的关注热点,并在很多领域发挥着重要作用,如:电子商务、电影和视频、音乐、社交网络、阅读、广告、基于位置的服务、新闻和个性化邮件等。

在推荐系统中,典型的推荐问题主要有两种:评分预测和Top-N 推荐。评分预测一直是推荐系统研究的热点,是指根据用户对项目的历史评分,学习用户的兴趣模型,预测用户对未评分项目的打分;而Top-N 推荐通常更符合实际的应用需求,是指提供用户可能喜欢的前N 个项目的有序列表。基于以上推荐问题,学术界和工业界提出了很多推荐理论和技术。经典的推荐算法主要分为三类:基于内容的推荐算法、协同过滤推荐算法和混合推荐算法[3]。

2. 推荐系统存在的问题 目前,很多推荐系统中都综合集成了各种的推荐方法和技术,虽然能提升推荐效果,但仍然面临着很多挑战,其中,冷启动问题、数据稀疏问题和用户兴趣漂移问题是推荐系统面临的三大难题。冷启动问题是指针对新用户、新项目或新系统没有历史评分数据的推荐问题;数据稀疏问题是指在海量的用户和项目信息中评价数据集的稀疏问题;用户兴趣漂移问题是指用户的兴趣随着时间、地点甚至是人物的变化而变化,如何建模用户的兴趣问题也是推荐系统面临的一大难题。

2.1. 冷启动问题 推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,因此大量的用户行为数据就成为推荐系统的重要组成部分和先决条件。当推荐系统积累数据量过少时,如何设计个性化推荐系统且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题,这也是推荐系统面临的一大难题。



相关标签