
摘要
遥感(RS)视觉任务在学术和实际应用中获得了显著的重要性。然而,这些任务面临着诸多挑战,阻碍了有效的特征提取,其中包括在同一图像中检测和识别具有显著尺度变化的多个对象。尽管先前的双分支或多分支架构策略在管理这些对象变化方面表现出有效性,但它们同时导致计算需求和参数数量大幅增加。因此,这些架构在资源受限设备上的部署变得不太可行。当前设计主要用于自然图像的轻量级主干网络,在有效提取多尺度对象特征方面经常遇到困难,这影响了其在遥感视觉任务中的效能。本文介绍了一种专门针对遥感视觉任务设计的轻量级主干网络——LWGANet,该网络集成了一个新颖的轻量级组注意力(LWGA)模块,旨在解决这些特定挑战。LWGA模块专为遥感影像设计,能够巧妙利用冗余特征提取从局部到全局范围内的广泛空间信息,而不会引入额外的复杂性或计算开销。这使得LWGANet能够在高效的框架内实现多尺度特征的精确提取。LWGANet在十二个数据集上进行了严格评估,涵盖了四个关键的遥感视觉任务:场景分类、定向目标检测、语义分割和变化检测。结果证实了LWGANet的广泛应用性和其在高性能与低复杂性之间保持最佳平衡的能力,在多种数据集上取得了最先进的(SOTA)结果。LWGANet成为一种适用于资源有限场景的新颖解决方案,具备强大的遥感影像处理能力。
代码仓库
lwcver/lwganet
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| change-detection-on-levir-cd | CLAFA-LWGANet L2 | F1: 92.42 F1-score: 92.42 IoU: 85.90 Precision: 93.25 |
| change-detection-on-whu-cd | CLAFA-LWGANet L2 | F1: 95.24 IoU: 90.92 Precision: 96.51 |
| image-classification-on-resisc45 | LWGANet L1 | Top 1 Accuracy: 95.70 |
| image-classification-on-resisc45 | LWGANet L0 | Top 1 Accuracy: 95.49 |
| image-classification-on-resisc45 | LWGANet L2 | Top 1 Accuracy: 96.17 |
| object-detection-in-aerial-images-on-dior-r | LWGANet L2 | mAP: 68.53 |
| object-detection-in-aerial-images-on-dota-1 | LWGANet L2 | mAP: 78.64 |
| semantic-segmentation-on-loveda | LWGANet L2 | Category mIoU: 53.6 |
| semantic-segmentation-on-uavid | LWGANet L2 | Mean IoU: 69.1 |