3 个月前

CACFNet:用于RGB-T城市场景解析的跨模态注意力级联融合网络

CACFNet:用于RGB-T城市场景解析的跨模态注意力级联融合网络

摘要

彩色-热成像(RGB-T)城市场景解析近年来受到广泛关注。然而,现有大多数RGB-T城市场景解析方法并未充分挖掘RGB与热成像模态之间的信息互补性。为此,本文提出一种跨模态注意力级联融合网络(Cross-Modal Attention-Cascaded Fusion Network, CACFNet),旨在充分挖掘跨模态信息的潜在价值。在设计中,跨模态注意力融合模块能够从双模态特征中有效提取互补信息;随后,级联融合模块以自底向上的方式解码多层级特征。考虑到每个像素均被赋予其所属区域的类别标签,本文进一步提出一种基于区域的模块,用于建模像素与区域之间的语义关联。此外,与以往仅采用交叉熵损失函数来约束像素级预测的方法不同,本文还引入一种新的损失函数,用于学习像素间的相互关系。在两个公开数据集上的大量实验表明,所提出的CACFNet在RGB-T城市场景解析任务中达到了当前最优的性能水平。

基准测试

基准方法指标
thermal-image-segmentation-on-mfn-datasetCACFNet
mIOU: 57.8
thermal-image-segmentation-on-pst900CACFNet
mIoU: 86.56

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
CACFNet:用于RGB-T城市场景解析的跨模态注意力级联融合网络 | 论文 | HyperAI超神经