
摘要
扩散方法在检索任务中常被用作排名或重排名手段,以实现更高的检索性能,并在近年来引起了广泛关注。然而,扩散的一个缺点是其执行速度较朴素的k近邻搜索(k-NN)慢,这在大规模数据集上会导致显著的在线计算成本。为克服这一弱点,本文提出了一种新颖的扩散技术。在我们的研究中,不是对查询进行扩散处理,而是预先计算数据库中每个元素的扩散结果,从而将在线搜索过程简化为基于k-NN搜索的线性组合。我们所提出的方法在在线搜索速度上提高了10倍左右。此外,我们建议使用后期截断而非先前工作中的早期截断,以获得更好的检索性能。
代码仓库
chjort/diffusion
pytorch
GitHub 中提及
fyang93/diffusion
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-retrieval-on-oxf105k | Offline Diffusion | MAP: 95.2% |
| image-retrieval-on-oxf5k | Offline Diffusion | MAP: 96.2% |
| image-retrieval-on-par106k | Offline Diffusion | mAP: 96.2% |
| image-retrieval-on-par6k | Offline Diffusion | mAP: 97.8% |