3 个月前

递归精炼 R-CNN：具有自适应 RoI 重平衡的实例分割

Leonardo Rossi Akbar Karimi Andrea Prati

摘要

在实例分割领域，当前大多数先进的深度学习网络普遍采用级联架构，即依次训练多个目标检测器，并在每一步重新采样真实标签（ground truth）。这种机制有效缓解了正样本指数级衰减的问题，但同时也导致网络参数量显著增加，模型复杂度上升。为解决这一问题，我们提出了一种递归精炼的R-CNN（R³-CNN）架构，通过引入循环机制避免重复计算，从而减少冗余。同时，该方法利用递归重采样技术，在每一次递归中采用特定的交并比（IoU）质量标准，逐步实现对正样本空间的均衡覆盖，从而提升检测质量。实验表明，R³-CNN在权重中显式编码了循环机制，因此必须在推理阶段启用该机制才能发挥其优势。在性能上，R³-CNN超越了近期提出的HTC模型，同时大幅减少了模型参数量。在COCO minival 2017数据集上的实验结果表明，该方法在不同基线模型下均能独立实现性能提升。相关代码已开源，地址为：https://github.com/IMPLabUniPr/mmdetection/tree/r3_cnn。

代码仓库

IMPLabUniPr/mmdetection

官方

pytorch

基准测试

基准	方法	指标
instance-segmentation-on-coco-minival	R3-CNN (ResNet-50-FPN, GC-Net)	AP50: 61.1 AP75: 43.5 APM: 42.8 APS: 22.6 mask AP: 40.2
instance-segmentation-on-coco-minival	R3-CNN (ResNet-50-FPN)	AP50: 58 AP75: 41.4 APL: 52.8 APM: 41 APS: 20.4 mask AP: 38.2
instance-segmentation-on-coco-minival	R3-CNN (ResNet-50-FPN, DCN)	AP50: 61.3 AP75: 44 APL: 56.1 APM: 43.6 APS: 22.3 mask AP: 40.4
instance-segmentation-on-coco-minival	R3-CNN (ResNet-50-FPN, GRoIE)	AP50: 58.8 AP75: 42.3 APL: 54.3 APM: 42.1 APS: 20.7 mask AP: 39.1
instance-segmentation-on-coco-minval	R3-CNN (ResNet-50-FPN, GC-Net)	APL: 56
object-detection-on-coco-minival	R3-CNN (ResNet-50-FPN, GC-Net)	AP50: 64.1 AP75: 48.4 APL: 58.9 APM: 47.1 APS: 27 box AP: 44.3
object-detection-on-coco-minival	R3-CNN (ResNet-50-FPN)	AP50: 61 AP75: 46.3 APL: 55.7 APM: 45.2 APS: 24.5 box AP: 42
object-detection-on-coco-minival	R3-CNN (ResNet-50-FPN, DCN)	AP50: 64.3 AP75: 48.9 APL: 59.6 APM: 48.3 APS: 26.6 box AP: 44.8
object-detection-on-coco-minival	R3-CNN (ResNet-50-FPN, GRoIE)	AP50: 61.2 AP75: 45.6 APS: 24.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程

即用型 GPU

最优价格

立即开始

Hyper Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供