4 个月前

面向大规模矩阵分解的字典学习

面向大规模矩阵分解的字典学习

摘要

稀疏矩阵分解是一种广泛使用的工具,用于获得可解释的数据分解,同时也有效地进行数据补全或去噪。为了提高其在大规模数据集上的适用性,已经提出了在线和随机化方法来降低其中一个矩阵维度的复杂度,但尚未同时降低两个维度的复杂度。本文中,我们解决了在两个维度上都非常大的矩阵问题。我们提出了一种新的分解方法,该方法能够优雅地扩展到太字节规模的数据集,而这些数据集以前的算法无法在合理的时间内处理。我们在大规模的功能磁共振成像(fMRI)数据和推荐系统中的矩阵补全问题上验证了我们的方法的有效性,在这些应用中,我们的方法相比最先进的坐标下降法获得了显著的速度提升。

代码仓库

基准测试

基准方法指标
collaborative-filtering-on-movielens-10mFactorization with dictionary learning
RMSE: 0.799
collaborative-filtering-on-movielens-1mFactorization with dictionary learning
RMSE: 0.866

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向大规模矩阵分解的字典学习 | 论文 | HyperAI超神经