3 个月前

自监督图学习在推荐系统中的应用

自监督图学习在推荐系统中的应用

摘要

在推荐系统中,基于用户-物品图的表示学习已从单一ID或交互历史的使用,演进至利用高阶邻居信息。这一演进推动了图卷积网络(GCNs)在推荐领域的成功应用,如PinSage和LightGCN等模型。然而,尽管这些方法效果显著,我们指出它们仍存在两大局限性:(1)度数较高的节点在表示学习过程中具有过大的影响力,导致低度数(长尾)物品的推荐性能下降;(2)表示对噪声交互较为敏感,因为邻域聚合机制会进一步放大观测边的影响。在本工作中,我们探索在用户-物品图上引入自监督学习,以提升GCN在推荐任务中的准确性和鲁棒性。其核心思想是,在传统的监督式推荐任务之外,引入一个辅助的自监督任务,通过自判别(self-discrimination)机制强化节点表示的学习。具体而言,我们为同一节点生成多个视图(view),并最大化同一节点不同视图之间的一致性,同时最小化与其他节点视图的一致性。为此,我们设计了三种图结构变换操作来生成视图:节点丢弃(node dropout)、边丢弃(edge dropout)和随机游走(random walk),它们以不同方式改变图的结构。我们将这一新型学习范式称为自监督图学习(Self-supervised Graph Learning, SGL),并将其应用于当前最先进的模型LightGCN。通过理论分析,我们发现SGL具备自动挖掘困难负样本(hard negatives)的能力。在三个基准数据集上的实证研究结果表明,SGL显著提升了推荐准确率,尤其在长尾物品的推荐上表现突出,同时增强了对交互噪声的鲁棒性。相关代码已开源,可访问:https://github.com/wujcan/SGL。

代码仓库

hkuds/sslrec
pytorch
GitHub 中提及
wujcan/sgl-torch
pytorch
GitHub 中提及
wujcan/SGL
官方
tf
GitHub 中提及

基准测试

基准方法指标
collaborative-filtering-on-yelp2018SGL
NDCG@20: 0.0555
Recall@20: 0.0675

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
自监督图学习在推荐系统中的应用 | 论文 | HyperAI超神经