
摘要
随着媒体流媒体的普及,众多视频流媒体服务持续采购新视频内容,以挖掘其潜在的商业价值。因此,新加入的内容必须得到妥善处理,以便精准推荐给合适的用户。本文针对新项目冷启动问题,探索了多种深度学习特征在视频推荐中的潜力。所研究的深度学习特征包括从视频内容中提取的视觉外观、音频信息以及运动特征。同时,本文还探讨了不同的特征融合方法,以评估这些不同模态特征在整合过程中如何充分挖掘其互补信息。在真实世界电影推荐数据集上的实验结果表明,深度学习特征显著优于人工设计的特征。特别是,基于深度学习音频特征和以动作为中心的深度学习特征所生成的推荐效果,优于传统的MFCC特征和当前最先进的iDT特征。此外,将多种深度学习特征与人工设计特征及文本元数据相结合,相较于仅融合深度学习特征的方法,能够显著提升推荐性能。
代码仓库
adolfo-almeida/scaled_cer
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| collaborative-filtering-on-movielens-10m | scaled-CER | MAP@15: 0.1568 MAP@30: 0.1671 MAP@5: 0.1536 NDCG@15: 0.2546 NDCG@30: 0.2971 NDCG@5: 0.1846 |