
摘要
协同过滤(Collaborative Filtering, CF)是推荐系统领域中广泛研究的核心课题。CF模型的训练通常依赖于三个关键组成部分:交互编码器、损失函数以及负采样策略。尽管现有大量研究聚焦于设计更强大的交互编码器,但损失函数的选择与负采样比例的影响尚未得到充分探索。本文研究表明,损失函数的设计与负采样比例同样至关重要。具体而言,我们提出了一种余弦对比损失(Cosine Contrastive Loss, CCL),并将其集成至一个简洁统一的CF模型——SimpleX中。我们在11个基准数据集上进行了大量实验,并与总共29种现有的CF模型进行了对比。令人惊讶的是,实验结果表明,在采用我们提出的CCL损失函数并配合较大的负采样比例时,SimpleX在性能上显著超越了多数复杂的先进模型(例如,在NDCG@20指标上相较LightGCN最高提升达48.5%)。我们相信,SimpleX不仅可作为一项简洁而强大的基线方法,推动未来协同过滤领域的研究发展,同时也为优化损失函数与负采样策略提供了新的研究方向。相关源代码将公开发布于 https://reczoo.github.io/SimpleX。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| collaborative-filtering-on-gowalla | SimpleX | NDCG@20: 0.1557 Recall@20: 0.1872 |
| collaborative-filtering-on-yelp2018 | SimpleX | NDCG@20: 0.0575 Recall@20: 0.0701 |
| recommendation-systems-on-amazon-book | SimpleX | Recall@20: 0.0583 nDCG@20: 0.0468 |
| recommendation-systems-on-gowalla | SimpleX | Recall@20: 0.1872 nDCG@20: 0.1557 |
| recommendation-systems-on-yelp2018 | SimpleX | NDCG@20: 0.0575 Recall@20: 0.0701 |