3 个月前

VDD:用于语义分割的多样化无人机数据集

VDD:用于语义分割的多样化无人机数据集

摘要

无人机图像的语义分割在各类航空视觉任务中具有关键作用,因为它能够提供理解地面场景所需的丰富语义信息。要确保无人机语义分割模型的高精度,通常需要依赖多样、大规模且高分辨率的数据集,然而在航空图像处理领域,这类数据集往往十分稀缺。现有数据集大多聚焦于城市场景,且规模相对有限。为此,我们提出了多样化无人机数据集(Varied Drone Dataset, VDD),该数据集包含400张高分辨率图像,覆盖7个语义类别,具有大规模、密集标注的特点。VDD涵盖城市、工业、乡村及自然等多种场景,图像由不同相机视角拍摄,并在多种光照条件下采集,具有较强的场景多样性与实用性。此外,我们还对现有的UDD和UAVid数据集进行了新的标注,并统一采用VDD的标注标准,整合形成集成无人机数据集(Integrated Drone Dataset, IDD),进一步提升了数据集的一致性与可用性。为建立基准性能,我们在无人机图像数据集上训练了七种当前最先进的语义分割模型。我们预期,VDD和IDD将激发学术界和工业界对无人机图像分割的广泛关注,并为其他无人机视觉任务提供坚实的数据基础。相关数据集已公开发布,可通过以下链接访问:https://github.com/RussRobin/VDD。

代码仓库

RussRobin/VDD
官方
GitHub 中提及

基准测试

基准方法指标
semantic-segmentation-on-vddSegformer-B0
mIoU: 75.37
semantic-segmentation-on-vddMask2Former(Swin-T)
mIoU: 77.85
semantic-segmentation-on-vddUperNet(Swin-L)
mIoU: 85.63
semantic-segmentation-on-vddUperNet(Swin-T)
mIoU: 84.73
semantic-segmentation-on-vddSegformer-B5
mIoU: 82.11
semantic-segmentation-on-vddMask2Former(ResNet-50)
mIoU: 83.21
semantic-segmentation-on-vddSegformer-B2
mIoU: 85.75

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
VDD:用于语义分割的多样化无人机数据集 | 论文 | HyperAI超神经