8 个月前

计算机视觉

计算机视觉

Nam Vo; Nathan Jacobs; James Hays

摘要

图像地理定位，即推断图像的地理位置，是一个具有许多潜在应用的挑战性计算机视觉问题。近期针对这一问题的最先进方法是一种深度图像分类方法，该方法将世界在空间上划分为若干单元格，并训练一个深度网络来预测给定图像所属的正确单元格。我们提出将这种方法与原始的Im2GPS方法相结合，后者通过将查询图像与地理标记图像数据库进行匹配，并从检索到的集合中推断出位置。我们通过对参考数据库中查询图像最近邻的位置应用核密度估计来估算其地理位置。有趣的是，我们发现对于我们的检索任务而言，最佳特征来自于使用分类损失训练的网络，尽管我们在测试时并未采用分类方法。使用分类损失进行训练的表现优于几种通常用于检索应用的深度特征学习方法（例如对比损失或三元组损失的Siamese网络）。我们的简单方法不仅达到了最先进的地理定位精度，而且所需训练数据显著减少。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

计算机视觉

Nam Vo; Nathan Jacobs; James Hays

摘要

图像地理定位，即推断图像的地理位置，是一个具有许多潜在应用的挑战性计算机视觉问题。近期针对这一问题的最先进方法是一种深度图像分类方法，该方法将世界在空间上划分为若干单元格，并训练一个深度网络来预测给定图像所属的正确单元格。我们提出将这种方法与原始的Im2GPS方法相结合，后者通过将查询图像与地理标记图像数据库进行匹配，并从检索到的集合中推断出位置。我们通过对参考数据库中查询图像最近邻的位置应用核密度估计来估算其地理位置。有趣的是，我们发现对于我们的检索任务而言，最佳特征来自于使用分类损失训练的网络，尽管我们在测试时并未采用分类方法。使用分类损失进行训练的表现优于几种通常用于检索应用的深度特征学习方法（例如对比损失或三元组损失的Siamese网络）。我们的简单方法不仅达到了最先进的地理定位精度，而且所需训练数据显著减少。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供