3 个月前

SimpleX:一种用于协同过滤的简单而强大的基线方法

SimpleX:一种用于协同过滤的简单而强大的基线方法

摘要

协同过滤(Collaborative Filtering, CF)是推荐系统领域中广泛研究的核心课题。CF模型的训练通常依赖于三个关键组成部分:交互编码器、损失函数以及负采样策略。尽管现有大量研究聚焦于设计更强大的交互编码器,但损失函数的选择与负采样比例的影响尚未得到充分探索。本文研究表明,损失函数的设计与负采样比例同样至关重要。具体而言,我们提出了一种余弦对比损失(Cosine Contrastive Loss, CCL),并将其集成至一个简洁统一的CF模型——SimpleX中。我们在11个基准数据集上进行了大量实验,并与总共29种现有的CF模型进行了对比。令人惊讶的是,实验结果表明,在采用我们提出的CCL损失函数并配合较大的负采样比例时,SimpleX在性能上显著超越了多数复杂的先进模型(例如,在NDCG@20指标上相较LightGCN最高提升达48.5%)。我们相信,SimpleX不仅可作为一项简洁而强大的基线方法,推动未来协同过滤领域的研究发展,同时也为优化损失函数与负采样策略提供了新的研究方向。相关源代码将公开发布于 https://reczoo.github.io/SimpleX。

基准测试

基准方法指标
collaborative-filtering-on-gowallaSimpleX
NDCG@20: 0.1557
Recall@20: 0.1872
collaborative-filtering-on-yelp2018SimpleX
NDCG@20: 0.0575
Recall@20: 0.0701
recommendation-systems-on-amazon-bookSimpleX
Recall@20: 0.0583
nDCG@20: 0.0468
recommendation-systems-on-gowallaSimpleX
Recall@20: 0.1872
nDCG@20: 0.1557
recommendation-systems-on-yelp2018SimpleX
NDCG@20: 0.0575
Recall@20: 0.0701

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
SimpleX:一种用于协同过滤的简单而强大的基线方法 | 论文 | HyperAI超神经