
摘要
预测用户响应(如点击率和转化率)在许多网络应用中至关重要,包括网络搜索、个性化推荐和在线广告。与图像和音频领域中常见的连续原始特征不同,网络空间中的输入特征通常具有多字段特性,且大多数为离散和分类特征,其依赖关系鲜为人知。主要的用户响应预测模型要么局限于线性模型,要么需要手动构建高阶组合特征。前者丧失了探索特征交互的能力,而后者则导致在大规模特征空间中计算负担过重。为了解决这一问题,我们提出了两种基于深度神经网络(DNNs)的新模型,以自动从分类特征交互中学习有效的模式并预测用户的广告点击行为。为了使我们的DNNs高效运行,我们提出利用三种特征转换方法,即因子分解机(Factorisation Machines, FMs)、受限玻尔兹曼机(Restricted Boltzmann Machines, RBMs)和去噪自编码器(Denoising Auto-Encoders, DAEs)。本文介绍了我们模型的结构及其高效的训练算法。大规模实验证明,使用真实数据时,我们的方法优于现有的主流先进模型。
代码仓库
wnzhang/deep-ctr
官方
tf
ddatta-DAC/Learning
tf
GitHub 中提及
shenweichen/DeepCTR
tf
GitHub 中提及
UlionTse/mlgb
pytorch
GitHub 中提及
shenweichen/DeepCTR-Torch
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| click-through-rate-prediction-on-company | FNN | AUC: 0.8683 Log Loss: 0.02629 |
| click-through-rate-prediction-on-criteo | FNN | AUC: 0.7963 Log Loss: 0.45738 |
| click-through-rate-prediction-on-ipinyou | FNN | AUC: 0.7619 |