Jacek DąbrowskiBarbara RychalskaMichał DanilukDominika BasajKonrad GołuchowskiPiotr BabelAndrzej MichałowskiAdam Jakubowski

摘要
许多无监督表示学习方法属于相似性学习模型的范畴。尽管针对不同类型数据已存在多种特定模态的方法,但许多方法的核心特性在于:在某种相似性度量下,相似输入的表示在空间中彼此接近。本文提出EMDE(高效流形密度估计器,Efficient Manifold Density Estimator)——一种利用具有局部相似性特性的任意向量表示的框架,能够简洁地表征黎曼流形上的平滑概率密度。我们的近似表示具备固定大小和简单可加组合性等优良特性,因此特别适用于神经网络处理,既可作为输入也可作为输出格式,从而实现高效的条件密度估计。我们将多模态推荐问题泛化并重新表述为流形上的条件加权密度估计问题。该方法能够轻松地融入多种交互类型、多模态数据以及不同交互强度,适用于各类推荐场景。在top-k推荐与会话推荐(session-based recommendation)两种设置下应用EMDE,我们在多个公开数据集上,在单模态与多模态场景中均取得了新的最先进(state-of-the-art)性能。
代码仓库
Synerise/booking-challenge
pytorch
GitHub 中提及
Synerise/kdd-cup-2021
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| session-based-recommendations-on-diginetica | EMDE | Hit@20: 37.52 MRR@20: 17.24 |
| session-based-recommendations-on-diginetica | EMDE MM | Hit@20: 38.49 MRR@20: 17.31 |
| session-based-recommendations-on-retailrocket | EMDE | Hit@20: 0.4704 MRR@20: 0.3524 |
| session-based-recommendations-on-retailrocket | EMDE MM | Hit@20: 0.5073 MRR@20: 0.3664 |
| session-based-recommendations-on-yoochoose1 | EMDE MM | MRR@20: 31.16 Precision@20: 74.3 |
| session-based-recommendations-on-yoochoose1 | EMDE | MRR@20: 31.04 Precision@20: 73.0 |