4 个月前

基于全局代理的硬样本挖掘用于视觉位置识别

基于全局代理的硬样本挖掘用于视觉位置识别

摘要

学习用于视觉位置识别的深度表示通常采用依赖于每次训练迭代中采样示例难度的成对损失函数或三元组损失函数。现有技术通过使用计算和内存开销较大的离线难样本挖掘来解决这一问题,即在每次迭代中从训练集中识别出最难的样本。本文介绍了一种基于代理的新技术,该技术执行全局难小批量采样。为此,我们在网络中添加了一个新的端到端可训练分支,该分支生成高效的位置描述符(每个位置一个代理)。这些代理表示被用来构建一个涵盖数据集中所有位置相似性的全局索引,从而在每次训练迭代中实现高度信息量的小批量采样。我们的方法可以与所有现有的成对损失函数和三元组损失函数结合使用,且几乎不会增加额外的内存和计算成本。我们进行了广泛的消融研究,并展示了我们的技术在多个大规模基准测试集上(如Pittsburgh、Mapillary-SLS和SPED)带来了新的最先进性能。特别是在具有挑战性的Nordland数据集上,我们的方法提供了超过100%的相对改进。我们的代码可在https://github.com/amaralibey/GPM 获取。

代码仓库

amaralibey/gpm
官方
GitHub 中提及

基准测试

基准方法指标
visual-place-recognition-on-mapillary-valNetVLAD (with GPM)
Recall@1: 82.0
Recall@10: 91.4
Recall@5: 90.4
visual-place-recognition-on-nordlandNetVLAD (with GPM)
Recall@1: 44.9
Recall@5: 50.2
visual-place-recognition-on-pittsburgh-250kNetVLAD (with GPM)
Recall@1: 91.5
Recall@10: 98.1
Recall@5: 97.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于全局代理的硬样本挖掘用于视觉位置识别 | 论文 | HyperAI超神经