7 个月前

摘要

近期的研究在利用全卷积网络（FCN）框架改进像素级标注的空间分辨率方面取得了显著进展，通过采用扩张/空洞卷积、利用多尺度特征以及优化边界等方法。本文中，我们探讨了全局上下文信息在语义分割中的影响，引入了上下文编码模块，该模块能够捕捉场景的语义上下文并有选择地突出类别相关的特征图。所提出的上下文编码模块在仅增加少量计算成本的情况下显著提升了语义分割的结果。我们的方法在PASCAL-Context数据集上达到了51.7%的平均交并比（mIoU），在PASCAL VOC 2012数据集上达到了85.9%的mIoU。此外，我们的单一模型在ADE20K测试集上获得了0.5567的最终得分，超过了2017年COCO-Place挑战赛的获胜作品。我们还探讨了上下文编码模块如何改善相对浅层网络在CIFAR-10数据集上的图像分类特征表示。我们的14层网络实现了3.45%的错误率，这一结果与层数超过其十倍的最先进方法相当。完整的系统源代码已公开发布。

源 PDF