
摘要
现有的地球视觉数据集要么适用于语义分割,要么适用于目标检测。在本研究中,我们引入了首个用于航拍图像实例分割的基准数据集,该数据集结合了实例级目标检测和像素级分割任务。与自然场景中的实例分割相比,航拍图像呈现出独特的挑战,例如每张图像中包含大量实例、物体尺度变化大以及存在大量微小物体。我们的大规模且密集标注的航拍图像实例分割数据集(iSAID)包含了2,806张高分辨率图像中的655,451个对象实例,涵盖15个类别。每个实例的精确逐像素标注确保了详细的场景分析所需的准确定位。与现有的基于小规模航拍图像的实例分割数据集相比,iSAID包含的目标类别数量是其15倍,实例数量是其5倍。我们使用两种流行的自然图像实例分割方法——Mask R-CNN和PANet对我们的数据集进行了基准测试。实验结果表明,直接将现成的Mask R-CNN和PANet应用于航拍图像会提供次优的实例分割结果,因此需要研究社区提出专门的解决方案。该数据集已公开发布,网址为:https://captain-whu.github.io/iSAID/index.html
代码仓库
yeliudev/catnet
pytorch
GitHub 中提及
CAPTAIN-WHU/iSAID_Devkit
官方
caffe2
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| instance-segmentation-on-isaid | PANet++ | Average Precision: 40.00 |
| instance-segmentation-on-isaid | PANet+ | Average Precision: 39.54 |
| object-detection-on-isaid | PANet++ | Average Precision: 47.0 |
| object-detection-on-isaid | PANet+ | Average Precision: 46.31 |