摘要
度量学习算法能够生成捕捉数据间重要关系的距离度量。本文研究了度量学习与协同过滤之间的联系,提出了一种协同度量学习(Collaborative Metric Learning, CML)方法。该方法学习一个联合度量空间,不仅能够编码用户的偏好,还能同时建模用户之间的相似性以及物品之间的相似性。在多种推荐任务中,所提出的CML算法优于当前最先进的协同过滤算法,并能够揭示用户细粒度偏好的内在谱结构。此外,CML在Top-K推荐任务中利用现成的近似最近邻搜索技术,实现了显著的加速,同时仅带来可忽略的精度损失。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| collaborative-filtering-on-million-song | CML | Recall@100: 0.3022 Recall@50: 0.2460 |
| collaborative-filtering-on-movielens-1m | CML | HR@10: 0.7216 nDCG@10: 0.5413 |
| collaborative-filtering-on-movielens-20m | CML | HR@10: 0.7764 Recall@100: 0.6022 Recall@50: 0.4665 nDCG@10: 0.5301 |
| collaborative-filtering-on-netflix | CML | Recall@10: 0.4612 nDCG@10: 0.2948 |