本文将时间因子融入反事实推理框架中,得到改进的无关模型的反事实推理框架。推荐系统的最终目的是提供给用户个性化的建议,而不是推荐流行的项目。借助因果关系中的反事实推理法来分析解决流行度偏见问题是一个新颖而基本的视角。流行度偏差是指热门的项目展示相对较多,系统推荐的时候,会倾向于推荐热门商品。当前的推荐模型只是考虑用户项目交互对最终评分的影响,忽略了时间因子对于交互过程的影响,所以对于流行度偏差消除的结果并不理想。由于用户和项目的匹配度不是一成不变的,它会随着时间非线性变化,为了提升模型消除流行度偏差的能力,本论文将时间因子纳入到了遵循因果推理的反事实推理框架中,从用户和项目交互的细节出发,细化了用户项目匹配,完成了对反事实推理框架的改进。实验使用矩阵分解算法和MovieLens数据集进行实验,融入时间因子的反事实推理框架对比传统的框架,命中率、召回率、归一化折损累计增益都有了一定的提高,提高了推荐算法的去流行度偏差能力。
推荐系统正在为各类用户提供个性化的服务,在电子商务、新闻网站、内容共享平台和社交媒体等广泛的在线应用中发挥着越来越重要的作用,然而,由于流行度偏差的存在,当前多数推荐系统更倾向于向用户推荐流行的项目,这与个性化推荐是背道而驰的。研究表明,流行偏见会导致推荐中的某些问题,例如随着时间的推移,用户的消费转向更主流的项目,甚至导致不同用户群体的同质化[1]。流行度偏差的出现是由长尾效应导致的,在互动的数据中,受到商品曝光机制、商品质量等因素的影响,多数情况下,频率的分布是不均匀的,整体呈现长尾分布,即少数项目占据了多数的交互,这就导致了推荐模型更偏向于推荐流行的项目。并不是所有的用户都喜欢流行的项目,流行度偏差的存在不仅会阻碍推荐者准确的理解用户偏好,同时也会导致推荐多样性的降低。马太效应[2]就是由流行度偏差所导致的, 越受欢迎的物品就越被更多的推荐,变得更加受欢迎。为了缓解流行度偏差,研究人员已经探索了许多的方法,这些方法主要进行的工作就是进行无偏见的学习和排名调整。例如,反向倾向评分(IPS),它重新加权了模型训练的交互,以此来调整数据的分布[3],虽然IPS 方法的理论基础已经很成熟了,但是因为它的模型方差和倾向性很难进行估计,在实践中难以实现。排名调整是在得到推荐列表以后进行二次排名[4],这种方法有意提高不太受欢迎的项目的分数,缺乏理论基础。消除流行偏见的关键并不是盲目的将推荐者推到长尾,而是仔细了解物品流行如何影响每次互动[5]。近几年,因果推断作为一个新颖的视角被引入到推荐系统中,从用户–项目交互、用户一致性和项目流行度出发,细粒度地分析并缓解流行度偏差,但是当前利用因果推断进行推荐仍然属于初步的尝试,并没有结合辅助信息。本文在此基础上对因果推理图以及遵循该因果图推理的反事实推理框架做了改进,因为在以往的因果推断过程中并没有考虑时间因素,这会影响用户–项目交互过程,从而影响最终用户对项目的评分,将时间因子纳入到