3 个月前

深度学习模型在土地覆盖图像分类中的基准测试与扩展性研究

深度学习模型在土地覆盖图像分类中的基准测试与扩展性研究

摘要

哥白尼哨兵-2(Copernicus Sentinel-2)影像数据的海量可用性为深度学习(DL)方法在土地利用与土地覆盖(LULC)图像分类中的应用开辟了全新机遇。然而,目前仍缺乏一套全面的基准实验体系,即在相同数据集上、采用统一且一致的评估指标,并在相同硬件环境下测试不同深度学习模型。在本研究中,我们首次利用BigEarthNet Sentinel-2数据集,对多种前沿深度学习模型在多标签、多分类LULC图像分类任务中进行系统性基准测试,构建了一个包含60个已训练模型的全面模型库。该基准涵盖标准卷积神经网络(CNN)以及非卷积类方法,重点评估了EfficientNets与宽残差网络(Wide Residual Networks, WRN)架构,并综合比较了分类精度、训练时间与推理速度等关键性能指标。此外,我们提出将EfficientNet的复合缩放(compound scaling)框架应用于轻量级WRN模型的结构优化。通过引入高效的通道注意力机制(Efficient Channel Attention),所构建的缩放后轻量模型成为新的最优方案。该模型在全部19个LULC类别上的平均F-Score分类准确率相较标准ResNet50基线模型提升了4.5%,同时可训练参数量减少了一个数量级。我们已公开所有训练完成的模型及其在多GPU节点上实现分布式训练的代码。这一预训练编码器模型库可广泛应用于基于Sentinel-2数据的各类遥感任务中的迁移学习与快速原型开发,避免依赖在不同领域数据(如ImageNet)上训练的主干网络。我们进一步在不同规模、多样化的数据集上验证了这些模型在迁移学习中的适用性。其中,表现最优的WRN模型在SEN12MS数据集上实现了71.1%的F-Score,达到当前最先进水平,而其训练过程仅使用了原始训练数据的一小部分。

代码仓库

orion-ai-lab/efficientbigearthnet
官方
tf
GitHub 中提及

基准测试

基准方法指标
multi-label-image-classification-onResNet50
FScore: 76.8
official split: Yes
multi-label-image-classification-onViTM/20
FScore: 77.1
official split: Yes
multi-label-image-classification-onWideResNet-B5-ECA
FScore: 79
official split: Yes
multi-label-image-classification-onMLPMixer
FScore: 75.2
official split: Yes
multi-label-image-classification-on-2ResNet50
F1 Score: 76.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
深度学习模型在土地覆盖图像分类中的基准测试与扩展性研究 | 论文 | HyperAI超神经