
摘要
凭借高机动性的优势,无人机(Unmanned Aerial Vehicles, UAVs)在计算机视觉领域被广泛应用于多种重要应用中,相比固定视角、尺度和视场的监控摄像头,无人机提供了更高的效率和便利性。然而,目前提出的无人机数据集非常有限,且主要集中在特定任务上,如在相对受限场景中的视觉跟踪或目标检测。因此,开发一个无约束的无人机基准测试以促进相关研究显得尤为重要。本文构建了一个新的无人机基准测试,重点关注具有新层次挑战的复杂场景。从10小时的原始视频中选取了约80,000个代表性帧,并对这些帧进行了全面标注,包括边界框以及多达14种属性(例如天气条件、飞行高度、相机视角、车辆类别和遮挡),用于三个基本的计算机视觉任务:目标检测、单目标跟踪和多目标跟踪。随后,我们使用最新的前沿算法对每个任务进行了详细的定量分析。实验结果表明,当前最先进的方法在我们的数据集上的表现相对较差,这是由于基于无人机的真实场景中出现了新的挑战,例如高密度、小目标和相机运动。据我们所知,这是首次全面探索无约束场景中这些问题的研究工作。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-uavdt | RON | mAP: 21.59 |
| object-detection-on-uavdt | SSD | mAP: 33.62 |
| object-detection-on-uavdt | R-FCN | mAP: 34.35 |
| object-detection-on-uavdt | Faster-RCNN | mAP: 22.32 |