
摘要
基于学习的立体匹配技术已经取得了显著进展。然而,现有的方法在生成特征通道的过程中不可避免地会丢失几何结构信息,导致边缘细节匹配错误。本文设计了一种名为Motif Channel Attention Stereo Matching Network(MoCha-Stereo)的网络来解决这一问题。我们引入了Motif Channel Correlation Volume(MCCV),以确定更精确的边缘匹配成本。MCCV通过将捕捉到特征通道中常见几何结构的motif通道投影到特征图和成本体积上实现。此外,重建误差图中的潜在特征通道的边缘变化也会影响细节匹配,为此我们提出了Reconstruction Error Motif Penalty(REMP)模块,以进一步优化全分辨率视差估计。REMP集成了来自重建误差的典型通道特征的频率信息。MoCha-Stereo在KITTI-2015和KITTI-2012反射排行榜上均排名第一。我们的结构在多视图立体匹配中也表现出色。代码可在https://github.com/ZYangChen/MoCha-Stereo 获取。
代码仓库
zyangchen/mocha-stereo
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| stereo-depth-estimation-on-kitti-2015 | MoCha-Stereo | D1-all All: 1.53 D1-all Noc: 1.44 |