
摘要
多光谱图像对能够提供互补的视觉信息,从而使行人检测系统更具鲁棒性和可靠性。为充分利用RGB与热红外(thermal IR)模态的优势,本文提出一种新颖的注意力驱动多光谱特征融合方法。在跨模态与模态内注意力模块的引导下,所提出的深度学习架构能够动态地权衡并融合多光谱特征。在两个公开的多光谱目标检测数据集上的实验结果表明,该方法在计算开销较低的情况下,显著提升了检测精度。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| multispectral-object-detection-on-flir-1 | GAFF (ResNet18) | mAP50: 72.9% |
| multispectral-object-detection-on-flir-1 | GAFF (VGG16) | mAP50: 72.7% |
| multispectral-object-detection-on-kaist | GAFF | Reasonable Miss Rate: 6.48 |