3 个月前

用于语义分割的多感受野网络

用于语义分割的多感受野网络

摘要

语义分割是计算机视觉中的关键任务之一,其目标是为图像中的每个像素分配一个类别标签。尽管近年来取得了显著进展,但现有大多数方法仍面临两个严峻挑战:其一,图像中物体与场景区域的尺寸差异极大,因此需要在全卷积网络(FCN)中引入多尺度特征;其二,位于物体或场景边界附近或处于边界的像素由于卷积网络固有的局限性,难以准确分类。针对第一个问题,我们提出了一种新型的多感受野模块(Multi-Receptive Field Module, MRFM),显式地融合多尺度特征。针对第二个问题,我们设计了一种边缘感知损失函数(edge-aware loss),能够有效区分物体与场景的边界区域。通过上述两项设计,所提出的多感受野网络(Multi Receptive Field Network)在两个广泛使用的语义分割基准数据集上取得了新的最先进性能。具体而言,在Cityscapes数据集上达到了83.0的平均交并比(mean IoU),在Pascal VOC2012数据集上达到了88.4的平均交并比(mean IoU)。

基准测试

基准方法指标
semantic-segmentation-on-cityscapesMRFM(coarse)
Mean IoU (class): 83.0%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于语义分割的多感受野网络 | 论文 | HyperAI超神经