矩阵分解(Matrix Factorization, MF)是构建推荐系统的有效方法之一。然而,传统的矩阵分解模型在应用于大规模稀疏数据场景时依然存在推荐准确率较差、训练速度较慢等严重不足。本文从提高推荐准确率和减少时间花销这两方面考虑,提出一种基于神经网络(Neural Network, NN)的融合用户信任关系(Trust)的矩阵分解(NN-MF-TR)模型。一方面,通过用户间潜在的信任与被信任关系充分挖掘用户的潜在偏好,从而提高推荐准确率。另一方面,在训练模型时引入神经网络,减少因多次迭代所造成的巨大时间花销。最后,通过选取四个有代表性的对比模型并在四个真实世界数据集上进行了实验验证。实验结果表明,本文提出的NN-MF-TR模型能够在保证提高推荐准确率的同时大大减少时间花销。
推荐系统[1] [2]可以从互联网上收集有关用户的偏好等信息, 旨在为客户提供个性化推荐。
推荐系统需要在较短时间内处理海量不同且稀疏的数据, 矩阵分解[3] [4] [5] [6]技术已被证明对于实现推荐系统是有用且可靠的。随着网络的发展使得用户和条目激增,导致评分矩阵中数据极度稀疏,使得大多数现有的推荐模型准确性较差。在现实世界中,我们总会向信任的朋友寻求推荐,所以信任关系可以作为推荐的辅助信息来缓解评分信息的稀疏[6] [7] [8]。然而,很少有研究从信任与被信任信息这一角度去探讨用户间的关联。因此,本文基于矩阵分解方法,利用用户间潜在的信任与被信任信息,来提高推荐准确率。
在如今这个快节奏时代中,效率一词成为大家共同追求的目标,模型的时间效率已逐渐成为判断其性能是否优秀的标准之一。
目前绝大多数的模型都通过随机梯度下降算法[9] [10] [11]等迭代学习算法[12]进行求解。尽管这种算法被广泛采纳,但是它需要通过多次迭代才会收敛,在大规模的数据集中,它的时间效率不尽如人意, 用非迭代算法替换迭代算法是至关重要的。
基于神经网络的训练过程是非迭代的, 会大大提高模型的时间效率。
综上,本文提出的NN-MF-TR 模型的主要贡献如下: 1) 利用用户间的信任与被信任关系提高推荐系统的性能。在提取用户的潜在信任与被信任关系时, 利用图拉普拉斯正则化,不仅保留了用户间的结构信息,还提高了模型的泛化能力。
2) 利用神经网络对模型进行训练,用非迭代算法替换迭代算法,大大提高模型的时间效率。
3) 四个真实世界的数据集上的实验结果可以表明,本文提出的模型在提高推荐准确率的同时大大提高了时间效率。
2. 相关工作 2.1. 矩阵分解 基于推荐系统的矩阵分解[3] [4]定义如下:假设, i jM Nr×= R为评分矩阵, , i jr代表用户i 对条目j 给出的评分,M 为用户的数量,N 为条目的数量。R 可分解成两个低秩矩阵的近似乘积,即用户特征矩阵