4 个月前

MMSFormer:多模态变压器用于材料和语义分割

MMSFormer:多模态变压器用于材料和语义分割

摘要

利用跨多种模态的信息已知可以提高多模态分割任务的性能。然而,由于每种模态的独特特性,有效融合不同模态的信息仍然具有挑战性。在本文中,我们提出了一种新颖的融合策略,能够有效地融合来自不同模态组合的信息。此外,我们还提出了一种新的模型——多模态分割变换器(Multi-Modal Segmentation TransFormer, MMSFormer),该模型集成了所提出的融合策略,用于执行多模态材料和语义分割任务。MMSFormer在三个不同的数据集上超越了当前最先进的模型。从仅使用一种输入模态开始,随着更多模态的加入,性能逐步提升,展示了融合模块在结合来自不同输入模态的有用信息方面的有效性。消融研究表明,融合块中的不同模块对整体模型性能至关重要。此外,我们的消融研究还强调了不同输入模态在识别不同类型材料时提高性能的能力。代码和预训练模型将在https://github.com/csiplab/MMSFormer上提供。

代码仓库

csiplab/mmsformer
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
semantic-segmentation-on-fmb-datasetMMSFormer (RGB-Infrared)
mIoU: 61.70
semantic-segmentation-on-fmb-datasetMMSFormer (RGB)
mIoU: 57.20
semantic-segmentation-on-mcubesMMSFormer (RGB-A-D-N)
mIoU: 53.11%
semantic-segmentation-on-mcubesMMSFormer (RGB-A)
mIoU: 51.30%
semantic-segmentation-on-mcubesMMSFormer (RGB)
mIoU: 50.44%
semantic-segmentation-on-mcubesMMSFormer (RGB-A-D)
mIoU: 52.05%
semantic-segmentation-on-mcubes-pMMSFormer (RGB-A)
mIoU: 51.30
semantic-segmentation-on-mcubes-pMMSFormer (RGB-A-D)
mIoU: 52.03
semantic-segmentation-on-mcubes-pMMSFormer (RGB)
mIoU: 50.44
thermal-image-segmentation-on-pst900MMSFormer
mIoU: 87.45

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MMSFormer:多模态变压器用于材料和语义分割 | 论文 | HyperAI超神经