
摘要
广义线性模型通过非线性特征变换在大规模回归和分类问题中被广泛应用于稀疏输入数据。通过广泛的交叉积特征变换来记忆特征交互是有效且可解释的,而泛化则需要更多的特征工程努力。相比之下,深度神经网络可以通过为稀疏特征学习低维密集嵌入(dense embeddings),在较少的特征工程下更好地泛化到未见过的特征组合。然而,当用户-项目交互稀疏且高秩时,带有嵌入的深度神经网络可能会过度泛化并推荐相关性较低的项目。本文介绍了宽深学习(Wide & Deep learning)——联合训练的宽线性模型和深度神经网络——以结合记忆和泛化的优点,用于推荐系统。我们在Google Play上实现了该系统并进行了评估,这是一个拥有超过十亿活跃用户和超过一百万应用程序的商业移动应用商店。在线实验结果显示,与仅使用宽模型或仅使用深模型相比,宽深学习显著增加了应用程序的获取量。我们还开源了在TensorFlow中的实现代码。
代码仓库
fengtong-xiao/DMBGN
pytorch
GitHub 中提及
aj9011/Wide-and-Deep
GitHub 中提及
qmonmous/pySpark-X-RecommenderSys--intro
GitHub 中提及
bytedance/largebatchctr
tf
GitHub 中提及
codlife/NLP
GitHub 中提及
aj9011/Wide-and-Deep-Demand-Forecasting
GitHub 中提及
yibeiou/Advanced_Business_Intelligence
GitHub 中提及
xue-pai/FuxiCTR
pytorch
GitHub 中提及
shenweichen/DeepCTR
tf
GitHub 中提及
jsleroux/Recommender-Systems
pytorch
GitHub 中提及
floraxhuang/Movie-Recommendation-System
GitHub 中提及
alibaba/TorchEasyRec
pytorch
alsoj/Recommenders-movielens
tf
GitHub 中提及
yil479/yelp_review
GitHub 中提及
aivolcano/RecSys_tf2
tf
GitHub 中提及
meabhishekkumar/iith_session_2020
tf
GitHub 中提及
UlionTse/mlgb
pytorch
GitHub 中提及
abmitra84/recommender_system
GitHub 中提及
shenweichen/DeepCTR-Torch
pytorch
GitHub 中提及
nebyu08/tiny_recommendation
pytorch
tangxyw/RecAlgorithm
tf
GitHub 中提及
GitHub-HongweiZhang/prediction-flow
pytorch
GitHub 中提及
qmonmous/BigData-X-Python
GitHub 中提及
vinaymittal22/Income_Prediction_US
GitHub 中提及
keyuchen886/GoodReads
GitHub 中提及
LeeHyeJin91/Wide_and_Deep
tf
GitHub 中提及
massquantity/LibRecommender
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| click-through-rate-prediction-on-amazon | Wide & Deep | AUC: 0.8637 |
| click-through-rate-prediction-on-bing-news | Wide & Deep | AUC: 0.8377 Log Loss: 0.2668 |
| click-through-rate-prediction-on-company | Wide & Deep (FM & DNN) | AUC: 0.8661 Log Loss: 0.02640 |
| click-through-rate-prediction-on-company | Wide & Deep (LR & DNN) | AUC: 0.8673 Log Loss: 0.02634 |
| click-through-rate-prediction-on-criteo | Wide&Deep | AUC: 0.7981 Log Loss: 0.46772 |
| click-through-rate-prediction-on-dianping | Wide & Deep | AUC: 0.8361 Log Loss: 0.3364 |
| click-through-rate-prediction-on-movielens | Wide & Deep | AUC: 0.7304 |