多数跨域推荐模型在利用评论文本进行跨域推荐时,没有考虑到评论文本中的情感信息。而对于考虑到评论情感信息的跨域模型多数都是进行单向跨域推荐。因此,本文提出一种基于评论情感向量化的双向跨域推荐模型。该模型对不同领域的评论文本利用bert + Transformer方法进行评论情感分类,得到隐含用户情感信息的情感向量化表示,再从中计算相对应的用户偏好向量和商品特征向量,然后根据生成的特征向量进行跨域推荐。对于跨域学习,本文在神经因子分解机(NFM)模型的基础上利用潜在正交映射函数学习两个域内的用户偏好以及跨域学习到的用户偏好,从而进行双向推荐。通过在四组数据集上进行对比实验,实验结果表明,该模型能有效缓解了数据稀疏的问题。
多数单领域推荐不能有效解决数据稀疏和冷启动问题,无法满足用户的需求,因此跨域推荐成为了推荐系统的热点之一。跨域推荐指通过把用户在领域A 中丰富的反馈信息的知识迁移到用缺乏该用户反馈信息的领域B 中进行商品推荐。
因此, 研究人员对于跨域推荐的研究多数是基于知识迁移上进行的[1]。
而在研究跨域推荐过程中, 常用的反馈信息是评论文本[2] [3], 原因在于评论文本中蕴含着丰富的用户偏好信息和商品特征信息,适合进行知识迁移。
然而,现有的多数跨域推荐模型都是基于数据密集的领域向数据稀疏的领域进行知识迁移的方式进行单向推荐[2] [3] [4],这些模型利用两个领域中的共同用户作为桥梁进行知识迁移,从而利用辅助域中的丰富信息来提高目标域的推荐效果,但这也意味着它们并没有利用目标域中的信息来帮助辅助域。然而,不同领域下的用户数据具有丰富性和多样性,如果可以同时利用这些用户的知识进行双向迁移,实现双向推荐,更能充分利用两个领域的知识,有利于缓解数据稀疏的问题。
基于上述问题,本文提出一种基于评论情感信息向量化的双向跨域推荐模型(Dual Cross Domain Rec-ommendation based on Sentiment Vectorization of Reviews, RSCDR)。该模型利用bert [5] + Transformer [6]的方式对每条评论文本中的情感信息进行文本情感向量化, 并分别计算出用户偏好向量和商品特征向量;然后,利用潜在正交映射的方式同时对两个领域进行跨域推荐,即在两个领域中,利用正交映射函数将用户的偏好从域A 中迁移到域B 中(反之亦然)。最后,本文利用NFM [7]进行评分预测。
2. 相关研究 单向跨域推荐的核心在于辅助域的知识如何迁移到目标域中。
Xu 等[2]认为利用评论文本中丰富的情感信息进行跨域推荐,能更好挖掘出用户偏好。因此,Xu 提出了一种新型的情感信息提取模型,该模型通过自动识别用户评论的语义方向提取出评论文本中的情感信息,并利用多层感知机MLP [8]将辅助域中的情感信息向目标域中迁移,从而进行跨域推荐。Fu 等[3]利用扩展的堆叠降噪自编码器(SDAE) [9]将