6 个月前

计算机视觉

卷积神经网络

计算机视觉

Kader Pustu-Iren Eric Muller-Budack Ralph Ewerth

摘要

尽管成功估算照片的地理定位能够支持多种有趣的应用，但这一任务本身极具挑战性。由于问题本身的复杂性，现有大多数方法仅适用于特定区域、特定影像类型或全球范围内的标志性地点。仅有少数研究能够实现无限制的GPS坐标预测。本文提出若干基于深度学习的方法，采用后一类思路，将地理定位问题建模为分类问题，即将地球表面划分为多个地理单元（地理格网）。我们进一步引入多层次的划分结构所蕴含的层次化知识，并结合照片场景内容特征（如室内、自然或城市环境等）进行综合建模。由此，卷积神经网络在学习过程中能够融合不同空间分辨率下的上下文信息，以及针对不同环境场景的更精细化特征。在两个基准数据集上的实验结果表明，所提方法在性能上超越现有最先进水平，同时显著减少了所需训练图像的数量，且不依赖于需要特定参考数据集的检索类方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

卷积神经网络

计算机视觉

Kader Pustu-Iren Eric Muller-Budack Ralph Ewerth

摘要

尽管成功估算照片的地理定位能够支持多种有趣的应用，但这一任务本身极具挑战性。由于问题本身的复杂性，现有大多数方法仅适用于特定区域、特定影像类型或全球范围内的标志性地点。仅有少数研究能够实现无限制的GPS坐标预测。本文提出若干基于深度学习的方法，采用后一类思路，将地理定位问题建模为分类问题，即将地球表面划分为多个地理单元（地理格网）。我们进一步引入多层次的划分结构所蕴含的层次化知识，并结合照片场景内容特征（如室内、自然或城市环境等）进行综合建模。由此，卷积神经网络在学习过程中能够融合不同空间分辨率下的上下文信息，以及针对不同环境场景的更精细化特征。在两个基准数据集上的实验结果表明，所提方法在性能上超越现有最先进水平，同时显著减少了所需训练图像的数量，且不依赖于需要特定参考数据集的检索类方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供