4 个月前

推荐系统中的宽深学习

推荐系统中的宽深学习

摘要

广义线性模型通过非线性特征变换在大规模回归和分类问题中被广泛应用于稀疏输入数据。通过广泛的交叉积特征变换来记忆特征交互是有效且可解释的,而泛化则需要更多的特征工程努力。相比之下,深度神经网络可以通过为稀疏特征学习低维密集嵌入(dense embeddings),在较少的特征工程下更好地泛化到未见过的特征组合。然而,当用户-项目交互稀疏且高秩时,带有嵌入的深度神经网络可能会过度泛化并推荐相关性较低的项目。本文介绍了宽深学习(Wide & Deep learning)——联合训练的宽线性模型和深度神经网络——以结合记忆和泛化的优点,用于推荐系统。我们在Google Play上实现了该系统并进行了评估,这是一个拥有超过十亿活跃用户和超过一百万应用程序的商业移动应用商店。在线实验结果显示,与仅使用宽模型或仅使用深模型相比,宽深学习显著增加了应用程序的获取量。我们还开源了在TensorFlow中的实现代码。

代码仓库

fengtong-xiao/DMBGN
pytorch
GitHub 中提及
aj9011/Wide-and-Deep
GitHub 中提及
bytedance/largebatchctr
tf
GitHub 中提及
codlife/NLP
GitHub 中提及
xue-pai/FuxiCTR
pytorch
GitHub 中提及
shenweichen/DeepCTR
tf
GitHub 中提及
jsleroux/Recommender-Systems
pytorch
GitHub 中提及
yil479/yelp_review
GitHub 中提及
aivolcano/RecSys_tf2
tf
GitHub 中提及
UlionTse/mlgb
pytorch
GitHub 中提及
shenweichen/DeepCTR-Torch
pytorch
GitHub 中提及
tangxyw/RecAlgorithm
tf
GitHub 中提及
keyuchen886/GoodReads
GitHub 中提及
LeeHyeJin91/Wide_and_Deep
tf
GitHub 中提及
massquantity/LibRecommender
tf
GitHub 中提及

基准测试

基准方法指标
click-through-rate-prediction-on-amazonWide & Deep
AUC: 0.8637
click-through-rate-prediction-on-bing-newsWide & Deep
AUC: 0.8377
Log Loss: 0.2668
click-through-rate-prediction-on-companyWide & Deep (FM & DNN)
AUC: 0.8661
Log Loss: 0.02640
click-through-rate-prediction-on-companyWide & Deep (LR & DNN)
AUC: 0.8673
Log Loss: 0.02634
click-through-rate-prediction-on-criteoWide&Deep
AUC: 0.7981
Log Loss: 0.46772
click-through-rate-prediction-on-dianpingWide & Deep
AUC: 0.8361
Log Loss: 0.3364
click-through-rate-prediction-on-movielensWide & Deep
AUC: 0.7304

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
推荐系统中的宽深学习 | 论文 | HyperAI超神经