
摘要
现有的旋转目标检测方法大多继承自水平目标检测范式,因为后者已发展为一个较为成熟的研究领域。然而,由于当前回归损失函数设计的局限性,尤其是在处理长宽比较大的目标时,这些方法在高精度检测任务中难以取得突出表现。本文从一个新视角出发,认为水平检测可视为旋转目标检测的一个特例,由此我们提出将旋转回归损失的设计范式由归纳式(induction)转向演绎式(deduction),以更好地体现旋转检测与水平检测之间的内在关联。我们指出,一个核心挑战在于如何调控旋转回归损失中各参数之间的耦合关系,使得在动态联合优化过程中,各估计参数能够以自适应且协同的方式相互影响。具体而言,本文首先将旋转边界框转换为二维高斯分布,进而通过计算两个高斯分布之间的KL散度(Kullback-Leibler Divergence, KLD)作为回归损失。通过对各参数梯度的分析,我们证明KLD及其导数能够根据目标自身的几何特性,动态调整各参数的梯度更新强度。特别是,该机制可根据目标的长宽比自适应地调节角度参数的梯度权重。这一特性在高精度检测中尤为关键,因为对于长宽比大的目标,微小的角度误差即可能导致检测精度显著下降。更重要的是,我们理论证明了KLD损失具有尺度不变性(scale invariance),这使其在不同尺度的目标上均能保持稳定的表现。此外,我们进一步表明,当旋转角度趋近于零时,KLD损失可退化为广泛使用的 $ l_n $-范数损失,从而自然兼容传统的水平检测任务。在七个不同数据集上,使用多种检测器进行的实验结果均验证了所提方法的一致优越性。相关代码已开源,分别发布于:https://github.com/yangxue0827/RotationDetection 和 https://github.com/open-mmlab/mmrotate。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-in-aerial-images-on-dota-1 | KLD+R3Det | mAP: 80.63% |