3 个月前

IGFNet:基于RGB-热成像的光照引导融合网络用于语义场景理解

IGFNet:基于RGB-热成像的光照引导融合网络用于语义场景理解

摘要

语义场景理解是自动驾驶中的基础性任务,为众多下游应用提供支撑。在光照条件恶劣的情况下,热成像图像能够为RGB图像提供互补信息。为此,已有大量基于RGB-热成像多模态数据的融合网络被提出,用于实现语义场景理解。然而,当前最先进的方法通常仅通过网络简单地融合多模态特征,缺乏对RGB图像与热成像图像内在特性进行深入分析与建模,因而其融合机制缺乏可解释性。为解决这一问题,本文提出IGFNet——一种光照引导的RGB-热成像语义场景理解融合网络。该网络通过光照估计模块生成权重掩码,动态地对不同网络阶段的RGB与热成像特征图进行加权融合,充分挖掘两种模态在不同光照条件下的互补优势。实验结果表明,IGFNet在MFNet数据集上的表现优于现有最先进方法。项目代码已开源,地址为:https://github.com/lab-sun/IGFNet。

基准测试

基准方法指标
thermal-image-segmentation-on-mfn-datasetIGFNet(B2)
mIOU: 59.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
IGFNet:基于RGB-热成像的光照引导融合网络用于语义场景理解 | 论文 | HyperAI超神经