4 个月前

多领域分类数据的深度学习:以用户响应预测为例的研究

多领域分类数据的深度学习:以用户响应预测为例的研究

摘要

预测用户响应(如点击率和转化率)在许多网络应用中至关重要,包括网络搜索、个性化推荐和在线广告。与图像和音频领域中常见的连续原始特征不同,网络空间中的输入特征通常具有多字段特性,且大多数为离散和分类特征,其依赖关系鲜为人知。主要的用户响应预测模型要么局限于线性模型,要么需要手动构建高阶组合特征。前者丧失了探索特征交互的能力,而后者则导致在大规模特征空间中计算负担过重。为了解决这一问题,我们提出了两种基于深度神经网络(DNNs)的新模型,以自动从分类特征交互中学习有效的模式并预测用户的广告点击行为。为了使我们的DNNs高效运行,我们提出利用三种特征转换方法,即因子分解机(Factorisation Machines, FMs)、受限玻尔兹曼机(Restricted Boltzmann Machines, RBMs)和去噪自编码器(Denoising Auto-Encoders, DAEs)。本文介绍了我们模型的结构及其高效的训练算法。大规模实验证明,使用真实数据时,我们的方法优于现有的主流先进模型。

代码仓库

ddatta-DAC/Learning
tf
GitHub 中提及
shenweichen/DeepCTR
tf
GitHub 中提及
UlionTse/mlgb
pytorch
GitHub 中提及
shenweichen/DeepCTR-Torch
pytorch
GitHub 中提及

基准测试

基准方法指标
click-through-rate-prediction-on-companyFNN
AUC: 0.8683
Log Loss: 0.02629
click-through-rate-prediction-on-criteoFNN
AUC: 0.7963
Log Loss: 0.45738
click-through-rate-prediction-on-ipinyouFNN
AUC: 0.7619

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
多领域分类数据的深度学习:以用户响应预测为例的研究 | 论文 | HyperAI超神经