
摘要
哥白尼哨兵-2(Copernicus Sentinel-2)影像数据的海量可用性为深度学习(DL)方法在土地利用与土地覆盖(LULC)图像分类中的应用开辟了全新机遇。然而,目前仍缺乏一套全面的基准实验体系,即在相同数据集上、采用统一且一致的评估指标,并在相同硬件环境下测试不同深度学习模型。在本研究中,我们首次利用BigEarthNet Sentinel-2数据集,对多种前沿深度学习模型在多标签、多分类LULC图像分类任务中进行系统性基准测试,构建了一个包含60个已训练模型的全面模型库。该基准涵盖标准卷积神经网络(CNN)以及非卷积类方法,重点评估了EfficientNets与宽残差网络(Wide Residual Networks, WRN)架构,并综合比较了分类精度、训练时间与推理速度等关键性能指标。此外,我们提出将EfficientNet的复合缩放(compound scaling)框架应用于轻量级WRN模型的结构优化。通过引入高效的通道注意力机制(Efficient Channel Attention),所构建的缩放后轻量模型成为新的最优方案。该模型在全部19个LULC类别上的平均F-Score分类准确率相较标准ResNet50基线模型提升了4.5%,同时可训练参数量减少了一个数量级。我们已公开所有训练完成的模型及其在多GPU节点上实现分布式训练的代码。这一预训练编码器模型库可广泛应用于基于Sentinel-2数据的各类遥感任务中的迁移学习与快速原型开发,避免依赖在不同领域数据(如ImageNet)上训练的主干网络。我们进一步在不同规模、多样化的数据集上验证了这些模型在迁移学习中的适用性。其中,表现最优的WRN模型在SEN12MS数据集上实现了71.1%的F-Score,达到当前最先进水平,而其训练过程仅使用了原始训练数据的一小部分。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| multi-label-image-classification-on | ResNet50 | FScore: 76.8 official split: Yes |
| multi-label-image-classification-on | ViTM/20 | FScore: 77.1 official split: Yes |
| multi-label-image-classification-on | WideResNet-B5-ECA | FScore: 79 official split: Yes |
| multi-label-image-classification-on | MLPMixer | FScore: 75.2 official split: Yes |
| multi-label-image-classification-on-2 | ResNet50 | F1 Score: 76.8 |