3 个月前

提升目标检索的三项关键认知

提升目标检索的三项关键认知

摘要

本研究的目标是在大规模图像数据集上实现基于图像查询的物体检索,要求在运行时能够即时完成检索,其方式类似于 Video Google [28]。本文提出以下三项主要贡献:(i) 提出一种新的 SIFT 描述子比较方法——RootSIFT,该方法在不增加计算或存储开销的前提下,显著提升了性能;(ii) 提出一种新颖的查询扩展方法,通过高效利用倒排索引,以适合即时检索的形式,判别性地学习更丰富的查询模型;(iii) 改进了 Turcot 与 Lowe [29] 提出的图像增强方法,仅保留与增强后图像在空间上保持一致的增强特征。我们在多个标准基准数据集(牛津建筑 5k 和 105k,以及巴黎 6k)上对上述三种方法进行了评估,结果表明,在保持即时检索速度的同时,检索性能得到了显著提升。将这些互补方法相结合,使得本方法在上述数据集上达到了新的最先进水平。

基准测试

基准方法指标
image-matching-on-imc-phototourismRootSIFT
mean average accuracy @ 10: 0.59859
image-matching-on-zebRootSIFT
Mean AUC@5°: 31.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
提升目标检索的三项关键认知 | 论文 | HyperAI超神经