4 个月前

级联R-CNN:高质量目标检测与实例分割

级联R-CNN:高质量目标检测与实例分割

摘要

在目标检测中,交并比(Intersection over Union, IoU)阈值常用于定义正负样本。训练检测器时所使用的阈值决定了其\textit{质量}。虽然常用的0.5阈值会导致噪声(低质量)检测,但当使用更大的阈值时,检测性能通常会下降。高质量检测的这一悖论有两个原因:1) 过拟合,由于大阈值下正样本数量急剧减少;2) 检测器与测试假设之间的推理时间质量不匹配。为了解决这些问题,提出了一种多阶段目标检测架构——级联R-CNN(Cascade R-CNN),该架构由一系列使用逐渐增大的IoU阈值训练的检测器组成。这些检测器依次进行训练,前一个检测器的输出作为下一个检测器的训练集。这种重采样过程逐步提高了假设的质量,确保所有检测器都有相同规模的正样本训练集,并最小化了过拟合问题。在推理过程中也应用了相同的级联结构,以消除假设与检测器之间的质量不匹配。一种没有额外复杂设计的级联R-CNN实现,在COCO数据集上达到了最先进的性能,并显著提升了通用和特定目标检测数据集(包括VOC、KITTI、CityPerson和WiderFace)上的高质量检测效果。最后,级联R-CNN被推广到实例分割任务中,在Mask R-CNN的基础上取得了非平凡的改进。为了促进未来的研究,提供了两种实现方式:\url{https://github.com/zhaoweicai/cascade-rcnn}(基于Caffe)和\url{https://github.com/zhaoweicai/Detectron-Cascade-RCNN}(基于Detectron)。

基准测试

基准方法指标
instance-segmentation-on-bdd100k-valCascade Mask R-CNN
AP: 19.8
object-detection-on-cocoCascade R-CNN
AP50: 62.1
AP75: 46.3
APL: 55.2
APM: 45.5
APS: 23.7
Hardware Burden: 15G
box mAP: 42.8
object-detection-on-coco-oCascade R-CNN (ResNet-50)
Average mAP: 18.2
Effective Robustness: 0.02

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
级联R-CNN:高质量目标检测与实例分割 | 论文 | HyperAI超神经