
摘要
预测用户响应(如点击和转化)具有重要意义,并已在许多网络应用中得到广泛应用,包括推荐系统、网络搜索和在线广告。这些应用中的数据大多为分类数据,并包含多个字段;一种典型的表示方法是通过独热编码将其转换为高维稀疏二进制特征表示。面对极端的稀疏性,传统模型可能难以从数据中挖掘浅层模式,即低阶特征组合。另一方面,深度模型如深度神经网络由于巨大的特征空间而无法直接应用于高维输入。在本文中,我们提出了一种基于乘积的神经网络(Product-based Neural Networks, PNN),该网络包含一个嵌入层以学习分类数据的分布式表示,一个乘积层以捕捉不同字段类别之间的交互模式,以及进一步的全连接层以探索高阶特征交互。我们在两个大规模真实广告点击数据集上的实验结果表明,PNN在各种指标上始终优于现有最先进模型。
代码仓库
wangweitong/DL
pytorch
GitHub 中提及
xue-pai/FuxiCTR
pytorch
GitHub 中提及
wangweitong/recommend_system
pytorch
GitHub 中提及
JianzhouZhan/Awesome-RecSystem-Models
pytorch
GitHub 中提及
shenweichen/DeepCTR
tf
GitHub 中提及
jamesdvance/predicting_clicks
GitHub 中提及
UlionTse/mlgb
pytorch
GitHub 中提及
tangxyw/RecAlgorithm
tf
GitHub 中提及
shenweichen/DeepCTR-Torch
pytorch
GitHub 中提及
Atomu2014/product-nets
官方
tf
GitHub 中提及
Atomu2014/product-nets-distributed
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| click-through-rate-prediction-on-amazon | PNN | AUC: 0.8679 |
| click-through-rate-prediction-on-bing-news | PNN | AUC: 0.8321 Log Loss: 0.2775 |
| click-through-rate-prediction-on-company | OPNN | AUC: 0.8658 Log Loss: 0.02641 |
| click-through-rate-prediction-on-company | PNN* | AUC: 0.8672 Log Loss: 0.02636 |
| click-through-rate-prediction-on-company | IPNN | AUC: 0.8664 Log Loss: 0.02637 |
| click-through-rate-prediction-on-criteo | IPNN | AUC: 0.7972 Log Loss: 0.45323 |
| click-through-rate-prediction-on-criteo | PNN* | AUC: 0.7987 Log Loss: 0.45214 |
| click-through-rate-prediction-on-criteo | OPNN | AUC: 0.7982 Log Loss: 0.45256 |
| click-through-rate-prediction-on-dianping | PNN | AUC: 0.8445 Log Loss: 0.3424 |
| click-through-rate-prediction-on-ipinyou | PNN* | AUC: 0.7661 |
| click-through-rate-prediction-on-ipinyou | IPNN | AUC: 0.7914 |
| click-through-rate-prediction-on-ipinyou | OPNN | AUC: 0.8174 |
| click-through-rate-prediction-on-movielens | PNN | AUC: 0.7321 |