
摘要
最先进的语义分割模型基于最初为图像分类设计的卷积网络的改进版本。然而,密集预测和图像分类在结构上存在差异。在这项工作中,我们开发了一种专门为密集预测设计的新卷积网络模块。该模块利用空洞卷积系统地聚合多尺度上下文信息而不损失分辨率。该架构基于空洞卷积支持在不损失分辨率或覆盖范围的情况下指数级扩展感受野这一事实。我们展示了所提出的上下文模块可以提高最先进的语义分割系统的准确性。此外,我们研究了将图像分类网络适应于密集预测的方法,并表明简化适应后的网络可以进一步提高准确性。
代码仓库
Wanger-SJTU/FCN-in-the-wild
pytorch
GitHub 中提及
harshmaru7/DilatedConv
tf
GitHub 中提及
vlievin/Unet
pytorch
GitHub 中提及
Rakeshpavan333/oct_dil
tf
GitHub 中提及
keillernogueira/FDSI
tf
GitHub 中提及
fyu/dilation
官方
caffe2
GitHub 中提及
ajaystar8/PDRUNet-PyTorch
pytorch
GitHub 中提及
Entodi/meshnet-pytorch
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| real-time-semantic-segmentation-on-camvid | Dilation10 | Frame (fps): 4.4 Time (ms): 227 mIoU: 65.3% |
| semantic-segmentation-on-ade20k | DilatedNet | Validation mIoU: 32.31 |
| semantic-segmentation-on-camvid | Dilated Convolutions | Mean IoU: 65.3% |
| semantic-segmentation-on-cityscapes | Dilation10 | Mean IoU (class): 67.1% |
| semantic-segmentation-on-pascal-voc-2012 | Dilated Convolutions | Mean IoU: 67.6% |