Munkhjargal GochooMunkh-Erdene OtgonboldErkhembayar GanboldJun-Wei HsiehMing-Ching ChangPing-Yang ChenByambaa DorjHamad Al JassmiGanzorig BatnasanFady AlnajjarMohammed AbduljabbarFang-Pang Lin

摘要
随着人工智能技术的发展,道路目标检测已成为计算机视觉领域的研究热点,传统方法主要依赖于透视相机。鱼眼镜头能够以更少的摄像头实现道路交叉口的全景广域覆盖,但其视场存在显著的图像畸变。据我们所知,目前尚无公开可用的、专为鱼眼摄像头交通监控任务构建的数据集。本文提出一个开放的 FishEye8K 基准数据集,用于道路目标检测任务,包含五个类别(行人、自行车、小汽车、公交车和卡车)共计15.7万个边界框标注。此外,本文还提供了多种前沿检测模型的基准测试结果,涵盖 YOLOv5、YOLOR、YOLOv7 和 YOLOv8 等系列模型的多种变体。该数据集由台湾新竹地区使用18个鱼眼摄像头采集的22段视频组成,共包含8,000张图像,图像分辨率为1080×1080和1280×1280。由于鱼眼图像具有超广角全景与半球形视场,畸变严重,且道路上参与者众多,尤其是骑乘电动自行车的人群,因此数据标注与验证过程极为复杂且耗时。为避免数据偏差,来自同一摄像头的帧被统一划分至训练集或测试集,确保每个类别在图像数量与边界框数量上均保持约70:30的训练与测试比例。实验结果表明,在输入尺寸为640×640时,YOLOv8表现更优;而在1280×1280输入尺寸下,YOLOR展现出更强的检测性能。该数据集将通过 GitHub 公开发布,并提供 PASCAL VOC、MS COCO 以及 YOLO 三种主流标注格式。FishEye8K 基准数据集的发布,将为鱼眼视频分析与智慧城市应用等领域提供重要支持,推动相关技术的发展与落地。
代码仓库
moyog/fisheye8k
官方
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 2d-object-detection-on-fisheye8k | Yolov8x (640x640) | mAP: 61.4 |