4 个月前

基于图先验的可扩展概率矩阵分解

基于图先验的可扩展概率矩阵分解

摘要

在矩阵分解中,可用的图侧信息可能并不适合矩阵补全问题,因为其中的边与从不完整数据矩阵中学到的潜在特征关系存在冲突。我们证明,移除这些$\textit{争议}$(contested)边可以提高预测准确性和可扩展性。我们通过一种高效的图形套索近似方法来识别这些争议边。争议边的识别和移除不会增加最先进的图正则化矩阵分解算法的计算复杂度,仍然保持与非零元素数量呈线性关系。计算负载甚至会随着移除边的数量成比例减少。通过构建一个概率生成模型并使用期望最大化方法扩展图正则化的交替最小二乘法(GRALS),可以保证算法收敛。丰富的模拟实验展示了该算法所具有的理想特性。在真实数据实验中,我们证明了通过减少图中的边数可以提高预测准确性(实验证据表明图侧信息通常不够准确)。对于一个具有30万维、300万条边的图(雅虎音乐侧信息),我们的图更新方法可以在标准笔记本电脑上不到十分钟内完成分析,这进一步证明了我们方法的高效性。

代码仓库

基准测试

基准方法指标
collaborative-filtering-on-movielens-100kGRAEM / KPMF
RMSE (u1 Splits): 0.9174
collaborative-filtering-on-yahoomusicGRALS
RMSE: 22.760
collaborative-filtering-on-yahoomusicGRAEM
RMSE: 22.795
recommendation-systems-on-douban-montiGRAEM / KPMF
RMSE: 0.7323
recommendation-systems-on-flixster-montiGRAEM
RMSE: 0.8857

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于图先验的可扩展概率矩阵分解 | 论文 | HyperAI超神经