3 个月前

多尺度匹配网络用于语义对应

多尺度匹配网络用于语义对应

摘要

深度特征在以往的多项研究中已被证明在构建精确的密集语义对应关系方面具有强大能力。然而,卷积神经网络所具有的多尺度与金字塔式层次结构尚未得到充分研究,以学习具有判别性的像素级特征用于语义对应。本文提出一种对邻近像素间微小语义差异敏感的多尺度匹配网络。我们采用自粗到细的匹配策略,并构建了一种与深层卷积神经网络多尺度层次结构相耦合的自顶向下的特征增强与匹配优化机制。在特征增强过程中,层内增强通过局部自注意力机制融合多层同分辨率的特征图,而层间增强则沿自顶向下的层次结构生成更高分辨率的特征图,实现特征的“幻觉”式重构。此外,我们在不同尺度上学习互补的匹配细节,使得整体匹配得分能够逐步由不同语义层次的特征进行优化。所提出的多尺度匹配网络可轻松实现端到端训练,且仅引入少量可学习参数。实验结果表明,该方法在三个主流基准测试上均取得了当前最优性能,并展现出高效的计算效率。

代码仓库

wintersun661/MMNet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
semantic-correspondence-on-spair-71kMMNet
PCK: 50.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供