6 个月前

卷积神经网络

计算机视觉

Libo Wang Rui Li Chenxi Duan Ce Zhang Xiaoliang Meng Shenghui Fang

摘要

具有编码器-解码器结构的全卷积网络（FCN）已成为语义分割任务的标准范式。该架构通过编码器提取多层级特征图，并由解码器将这些特征融合以生成最终的分割预测。由于上下文信息对于实现精确分割至关重要，研究者们已投入大量努力，以智能化方式提取此类信息，例如采用空洞卷积（dilated/atrous convolutions）或引入注意力模块。然而，这些方法均基于以ResNet等为基础的FCN架构，难以从理论上充分挖掘上下文信息。相比之下，本文提出采用Swin Transformer作为主干网络，以更有效地提取上下文特征，并设计了一种新型解码器结构——密集连接特征聚合模块（Densely Connected Feature Aggregation Module, DCFAM），用于恢复特征分辨率并生成最终的分割结果。在两个遥感语义分割数据集上的实验结果验证了所提方法的有效性。代码已开源，地址为：https://github.com/WangLibo1995/GeoSeg。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Libo Wang Rui Li Chenxi Duan Ce Zhang Xiaoliang Meng Shenghui Fang

摘要

具有编码器-解码器结构的全卷积网络（FCN）已成为语义分割任务的标准范式。该架构通过编码器提取多层级特征图，并由解码器将这些特征融合以生成最终的分割预测。由于上下文信息对于实现精确分割至关重要，研究者们已投入大量努力，以智能化方式提取此类信息，例如采用空洞卷积（dilated/atrous convolutions）或引入注意力模块。然而，这些方法均基于以ResNet等为基础的FCN架构，难以从理论上充分挖掘上下文信息。相比之下，本文提出采用Swin Transformer作为主干网络，以更有效地提取上下文特征，并设计了一种新型解码器结构——密集连接特征聚合模块（Densely Connected Feature Aggregation Module, DCFAM），用于恢复特征分辨率并生成最终的分割结果。在两个遥感语义分割数据集上的实验结果验证了所提方法的有效性。代码已开源，地址为：https://github.com/WangLibo1995/GeoSeg。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供