3 个月前

多模态材料分割

多模态材料分割

摘要

基于视觉外观识别材料对于计算机视觉任务至关重要,尤其是在涉及与现实世界交互的应用中。材料分割(即密集的逐像素材料识别)仍面临挑战,因为与物体不同,材料在常规的RGB图像中通常缺乏清晰可辨的视觉特征。然而,不同材料会表现出不同的辐射特性,这些特性往往可通过非RGB成像模态加以捕捉。本文实现了基于RGB、偏振和近红外图像的多模态材料分割。为此,我们构建了MCubeS数据集(全称为多模态材料分割数据集),该数据集包含500组多模态图像,覆盖42个街景场景。每幅图像均标注了像素级的真实材料分割结果以及语义分割标签。此外,我们提出了一种新型深度神经网络MCubeSNet,其通过一种新设计的区域引导滤波选择(Region-Guided Filter Selection, RGFS)层,自动学习针对每一类材料最具信息量的成像模态组合。该网络利用语义分割结果作为先验信息,指导滤波器的选择过程。据我们所知,本工作是首个关于真正意义上的多模态材料分割的综合性研究。我们认为,本研究为材料信息在安全关键应用中的实际落地开辟了新的路径。

基准测试

基准方法指标
semantic-segmentation-on-mcubesMCubeSNet (RGB-A-D-N)
mIoU: 42.86%
semantic-segmentation-on-uplightMCubeSNet (RGB-AoLP)
mIoU: 82.64
semantic-segmentation-on-uplightMCubeSNet (RGB-DoLP)
mIoU: 80.80

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
多模态材料分割 | 论文 | HyperAI超神经