
摘要
近年来,图神经网络(Graph Neural Network, GNN)在矩阵补全任务中展现出强大能力,其核心思想是将评分矩阵建模为一个二部图,通过预测用户节点与物品节点之间的潜在连接来完成缺失评分的预测。现有的大多数基于GNN的矩阵补全方法均基于图自编码器(Graph Autoencoder, GAE)框架:该框架以独热编码(one-hot index)作为输入,将用户(或物品)的索引映射为可学习的嵌入表示,利用GNN基于这些嵌入学习节点特定的表示,并最终聚合目标用户及其对应物品节点的表示以预测缺失链接。然而,在缺乏节点内容信息(即辅助信息)的情况下,现有方法在归纳设置(inductive setting)下难以学习到用户或物品的特定表示——这意味着在某一用户群体上训练的模型无法有效适应新出现的用户或物品。针对这一问题,本文提出一种基于GAE的归纳式矩阵补全方法(Inductive Matrix Completion with GAE, IMC-GAE),该方法利用GAE同时学习用户(或物品)特定的表示以支持个性化推荐,以及局部图结构模式以实现归纳式矩阵补全。具体而言,我们设计了两种具有信息量的节点特征,并在GAE中引入分层节点丢弃(layer-wise node dropout)策略,以有效学习可泛化至未见数据的局部图模式。本文的主要贡献在于:首次实现了在GAE框架下高效学习局部图模式的能力,相较于以往基于GNN的矩阵补全方法,展现出更优的可扩展性与更强的表达能力。大量实验结果表明,所提模型在多个矩阵补全基准数据集上均取得了当前最优(state-of-the-art)的性能表现。本文的官方代码已公开发布,供学术界与工业界参考与使用。
代码仓库
swtheing/Multiview-Link-Representation-Learning
pytorch
GitHub 中提及
swtheing/imc-gae
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| collaborative-filtering-on-movielens-1m | IMC-GAE | RMSE: 0.829 |