4 个月前

具有深度感知能力的CNN用于RGB-D分割

具有深度感知能力的CNN用于RGB-D分割

摘要

卷积神经网络(CNN)由于其固定的网格核结构,处理几何信息的能力有限。深度数据的可用性使得利用CNN在RGB-D语义分割方面取得了进展。现有的最先进方法要么将深度作为附加图像使用,要么在三维体素或点云中处理空间信息。然而,这些方法面临着高计算成本和内存消耗的问题。为了解决这些问题,我们提出了一种深度感知CNN,通过引入两种直观、灵活且有效的操作:深度感知卷积和深度感知平均池化。通过在信息传播过程中利用像素之间的深度相似性,几何信息被无缝地融入到CNN中。这两种操作无需引入任何额外参数,可以轻松集成到现有的CNN架构中。我们在具有挑战性的RGB-D语义分割基准上进行了广泛的实验和消融研究,验证了我们方法的有效性和灵活性。

代码仓库

virkay/DepthAwareCNN2
pytorch
GitHub 中提及
laughtervv/DepthAwareCNN
官方
pytorch
GitHub 中提及
iriszero/DepthAwareCNNplus
pytorch
GitHub 中提及
aksh1501/DepthAware_CNN_edit
pytorch
GitHub 中提及

基准测试

基准方法指标
semantic-segmentation-on-nyu-depth-v2Depth-aware CNN
Mean IoU: 43.9%
semantic-segmentation-on-stanford2d3d-rgbdDepth-aware CNN
Pixel Accuracy: 65.4
mAcc: 55.5
mIoU: 39.5
semantic-segmentation-on-sun-rgbdTokenFusion (S)
Mean IoU: 42.0%
thermal-image-segmentation-on-mfn-datasetDepth-aware CNN
mIOU: 46.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
具有深度感知能力的CNN用于RGB-D分割 | 论文 | HyperAI超神经