
摘要
任意方向目标检测是涉及航拍图像与场景文本等视觉场景中的基础任务。本文提出PP-YOLOE-R,一种基于PP-YOLOE架构的高效无锚框旋转目标检测模型。在PP-YOLOE-R中,我们引入了一系列实用技巧,在仅增加少量额外参数和计算开销的前提下,显著提升了检测精度。实验结果表明,在单尺度训练与测试条件下,PP-YOLOE-R-l与PP-YOLOE-R-x在DOTA 1.0数据集上分别达到78.14和78.28的mAP,显著优于绝大多数现有旋转目标检测方法。在采用多尺度训练与测试策略时,二者性能进一步提升至80.02和80.73 mAP,其中PP-YOLOE-R-x超越了所有无锚框方法,并在性能上与当前最先进的基于锚框的两阶段模型相当,展现出卓越的竞争力。此外,PP-YOLOE-R具备良好的部署友好性,结合TensorRT与FP16精度,在RTX 2080 Ti硬件平台上,PP-YOLOE-R-s/m/l/x的推理速度分别可达69.8/55.1/48.3/37.1 FPS。项目源代码及预训练模型已开源,可通过以下链接获取:https://github.com/PaddlePaddle/PaddleDetection,该项目由PaddlePaddle(https://github.com/PaddlePaddle/Paddle)提供技术支持。
代码仓库
PaddlePaddle/Paddle
官方
paddle
PaddlePaddle/PaddleDetection
官方
paddle
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-in-aerial-images-on-dota-1 | PP-YOLOE-R-m | mAP: 79.71% |
| object-detection-in-aerial-images-on-dota-1 | PP-YOLOE-R-l | mAP: 80.02% |
| object-detection-in-aerial-images-on-dota-1 | PP-YOLOE-R-x | mAP: 80.73% |
| object-detection-in-aerial-images-on-dota-1 | PP-YOLOE-R-s | mAP: 79.42% |