
摘要
低秩矩阵补全在协同过滤应用中发挥着基础性作用,其核心思想是:变量实际位于一个比环境空间维度更低的子空间中。通常,我们对变量还掌握额外信息,合理推测引入这些信息将有助于提升预测性能。本文研究了在已知变量间成对关系(通过图结构表示)的条件下矩阵补全问题。我们提出并推导了一种高效且基于共轭梯度的交替最小化算法,该方法在处理超过5500万条观测数据时,相较当前最先进的(随机)梯度下降类方法,计算速度提升高达两个数量级。在理论层面,我们证明了此类方法可推广为加权核范数正则化形式,并给出了相应的统计一致性保证。我们在真实数据集与合成数据集上均对所提方法进行了验证,结果表明其具有优异的性能与泛化能力。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| collaborative-filtering-on-douban | GRALS | RMSE: 0.714 |
| collaborative-filtering-on-flixster | GRALS | RMSE: 0.845 |
| collaborative-filtering-on-movielens-100k | GRALS | RMSE (u1 Splits): 0.945 |
| collaborative-filtering-on-yahoomusic | GRALS | RMSE: 22.872 |
| recommendation-systems-on-douban-monti | GRALS | RMSE: 0.8326 |
| recommendation-systems-on-flixster-monti | GRALS | RMSE: 1.2447 |
| recommendation-systems-on-yahoomusic-monti | GRALS | RMSE: 38.0423 |