3 个月前

递归精炼 R-CNN:具有自适应 RoI 重平衡的实例分割

递归精炼 R-CNN:具有自适应 RoI 重平衡的实例分割

摘要

在实例分割领域,当前大多数先进的深度学习网络普遍采用级联架构,即依次训练多个目标检测器,并在每一步重新采样真实标签(ground truth)。这种机制有效缓解了正样本指数级衰减的问题,但同时也导致网络参数量显著增加,模型复杂度上升。为解决这一问题,我们提出了一种递归精炼的R-CNN(R³-CNN)架构,通过引入循环机制避免重复计算,从而减少冗余。同时,该方法利用递归重采样技术,在每一次递归中采用特定的交并比(IoU)质量标准,逐步实现对正样本空间的均衡覆盖,从而提升检测质量。实验表明,R³-CNN在权重中显式编码了循环机制,因此必须在推理阶段启用该机制才能发挥其优势。在性能上,R³-CNN超越了近期提出的HTC模型,同时大幅减少了模型参数量。在COCO minival 2017数据集上的实验结果表明,该方法在不同基线模型下均能独立实现性能提升。相关代码已开源,地址为:https://github.com/IMPLabUniPr/mmdetection/tree/r3_cnn。

代码仓库

基准测试

基准方法指标
instance-segmentation-on-coco-minivalR3-CNN (ResNet-50-FPN, GC-Net)
AP50: 61.1
AP75: 43.5
APM: 42.8
APS: 22.6
mask AP: 40.2
instance-segmentation-on-coco-minivalR3-CNN (ResNet-50-FPN)
AP50: 58
AP75: 41.4
APL: 52.8
APM: 41
APS: 20.4
mask AP: 38.2
instance-segmentation-on-coco-minivalR3-CNN (ResNet-50-FPN, DCN)
AP50: 61.3
AP75: 44
APL: 56.1
APM: 43.6
APS: 22.3
mask AP: 40.4
instance-segmentation-on-coco-minivalR3-CNN (ResNet-50-FPN, GRoIE)
AP50: 58.8
AP75: 42.3
APL: 54.3
APM: 42.1
APS: 20.7
mask AP: 39.1
instance-segmentation-on-coco-minvalR3-CNN (ResNet-50-FPN, GC-Net)
APL: 56
object-detection-on-coco-minivalR3-CNN (ResNet-50-FPN, GC-Net)
AP50: 64.1
AP75: 48.4
APL: 58.9
APM: 47.1
APS: 27
box AP: 44.3
object-detection-on-coco-minivalR3-CNN (ResNet-50-FPN)
AP50: 61
AP75: 46.3
APL: 55.7
APM: 45.2
APS: 24.5
box AP: 42
object-detection-on-coco-minivalR3-CNN (ResNet-50-FPN, DCN)
AP50: 64.3
AP75: 48.9
APL: 59.6
APM: 48.3
APS: 26.6
box AP: 44.8
object-detection-on-coco-minivalR3-CNN (ResNet-50-FPN, GRoIE)
AP50: 61.2
AP75: 45.6
APS: 24.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
递归精炼 R-CNN:具有自适应 RoI 重平衡的实例分割 | 论文 | HyperAI超神经