现有的推荐算法大多是基于同类商品进行推荐,容易形成“信息茧房”。为了解决同类商品推荐的局限
随着互联网的不断发展,人们每天产生与接收的信息量呈爆炸式增长,在无形中造成了信息过载的问题。人们迫切需要在海量信息中快速获取他们感兴趣的部分,即所谓个性化信息,于是推荐系统和推荐算法就此应运而生。推荐算法的本质是一种信息过滤技术,它根据用户对事物的偏好或者观察到的行为,通过过滤出大量的动态以及重要信息的片段,来解决信息过载的问题[1]。同时,推荐算法作为偏好学习的重要应用方向之一,其类型下的商品推荐系统已广泛应用于我们的生活之中。国内外也有很多学者对推荐算法进行了深入的研究和探讨。
江海洋(2010)提出了在评论中挖掘文字信息的新方法, 将评论中用户所关注的信息挖掘出来并进行评分,从而对其他待评分对象进行预测并产生推荐[2];李京等(2011)在研究推荐库和用户兴趣模型的基础上加入了推荐引擎, 实现了基于电子商务的个性化推荐系统[3];崔睿宇等(2019)系统地介绍了基于内容、协同过滤、基于关联规则、基于知识和基于人口统计信息等主流的推荐算法,对组合推荐算法的思路也进行了简要介绍,给出了算法评价标准并使用实验常用数据集进行了实证研究[4];而国外也有很多学者也对此进行了深入的研究, 如Mohsen Ahmadi Fahandar 等(2017)提出基于类比推理的排序学习的方法[5];Sandeep K. Raghuwanshi 等人(2019)针对推荐系统中的协同过滤技术进行了研究[6];Bag, Sujoy 等人研究了使用相关的Jaccard 相似度进行有效的推荐生成[7]。
推荐算法的出现和发展改变了信息检索和个性化推荐的模式,也有效地解决了数据过载等问题。随着推荐算法的深入研究与推广,推荐算法作为一种全新的、智能化的方法已经被广泛地使用到了生活中的各个领域之中,如商品推荐、广告推荐、浏览推荐等。然而,目前已经存在的绝大部分的推荐系统的研究主要集中在同类物品的推荐算法上[8]。为了解决不同类别的个性化推荐问题,本文提出了一种基于物品相似度的异构推荐算法,并且以异类商品的推荐为例,进行深入的研究与探讨。
2. 物品相似度 在进行推荐算法的研究时,通常会涉及相似度理论及计算,相似度可以用来衡量用户或项目之间的相似或相关程度。在推荐算法的研究中,为了将不同的物品关联起来而使用的相似度有物品相似度和用户相似度,物品相似度是用来衡量物品之间的相似度大小,而用户相似度衡量的是不同用户之间的相似度值[9]。本文需要解决的关键问题是如何将不同类别的商品联系起来,这里就采用物品相似度理论来完成异类商品的推荐。下面介绍几个相关的概念。