推荐方法是解决“信息过载”问题的一种热门研究技术,传统的推荐方法在音乐、视频、新闻等领域存在数据稀疏、冷启动等问题,将深度学习融入推荐方法中,可以有效解决上述问题。对传统推荐方法在音乐、视频、新闻等领域的应用进行分析,重点介绍基于深度学习的音乐和视频领域的推荐方法,最后对基于深度学习的推荐方法进行了总结和展望。 *通讯作者。
互联网技术的快速发展,促进了数据信息的爆炸式增长。2017 年全球数据总存量轨迹是16~20 ZB, 再过8 年,总存量仍将增长10 倍,接近200ZB。虽然海量数据蕴含丰富的价值,但是存在严重的“信息过载、信息焦虑、信息冗余”等问题。为了解决“信息过载”问题,研究人员分析该问题产生原因,积极寻找应对策略[1]。截止目前,能够解决“信息过载”的方法包括搜索引擎技术、数据库系统、推荐系统。搜索引擎[2] [3] [4]能够自动从互联网上搜索信息,信息经过整理后,提供给用户进行查询,但这些信息存在数据量大的特点,进而导致搜索时间过长,不能及时给用户提供有用的信息;数据库系统[5] [6] [7] [8] [9]不仅可以存储和管理数据,而且能够处理各种业务,但是当数据量庞大时,仍存在数据冗余现象,从而导致用户无法及时处理业务。以上两种方法存在不同的问题,为了解决这些问题,研究人员提出推荐系统将其应用在海量数据的处理中,推荐系统能够为用户生成推荐项列表或者预测用户偏好哪一项, 有针对性便捷地为用户提供可能让他们喜欢的内容[10], 从而减少用户搜索的时间以及提高推荐准确度。目前,推荐系统用于决策的过程中,是解决“信息过载”问题最好的手段之一。
而推荐系统最初开始于一个有趣的现象:人们在生活中做决定的时候总会倾向于听取别人提供的建议[11]。在20 世纪末期,Su 等人[12]第一个提出协同过滤技术,这标志着推荐系统成为一门独立的学科而受到广泛的关注。传统的推荐方法主要有两种:基于内容的推荐方法[13]和协同过滤推荐方法[14]。传统的推荐方法大部分都存在冷启动、用户兴趣偏移、数据稀疏等问题,融合两种方法的混合推荐方法[15]能够缓解数据稀疏、冷启动问题,但是由于往往收集到的数据具有数据异构、分布不均匀等复杂特征, 混合推荐方法仍面临极大的挑战[16] [17]。
深度学习技术是机器学习领域的一个热门研究技术,已经广泛应用于许多领域如图像处理、语言识别和自然语言理解等,这为推荐方法的研究指引了新的方向。一方面深度学习可以自动学习数据特征, 学习潜在的隐性因子,为推荐方法缓解冷启动问题;另一方面深度学习可以通过数据增广、迁移学习、领域自适应、主动学习等方法缓解数据稀疏问题。目前,基于深度学习的推荐方法在众多领域应用的研究越来越多[18]-[29],基于深度学习的推荐方法研究已经成为推荐方法领域的研究热点之一。
本文首先简要介绍了传统的推荐方法在音乐、视频、新闻领域的应用,然后重点分析深度学习在音乐推荐系统以及视频推荐系统中的应用,最后是总结全文以及对基于深度学习的推荐系统的展望。
2. 传统推荐方法 2.1. 音乐推荐方法 2.1.1. 基于内容的音乐混合推荐方法 为了解决过于依赖专家形成的特定音乐特征集的问题, 潘洋等人[30]提出一种基于用户行为的研究方法,通过获取用户日常收听、播放、收藏等操作行为数据,将这些用户行为数据构建出行为特征模型,