
摘要
本文介绍了lvisTraveler团队在LVIS Challenge 2020中的解决方案。在本工作中,主要考虑了LVIS数据集的两个关键特性:长尾分布问题以及高质量实例分割掩码。为此,团队采用两阶段训练流程:在第一阶段,引入EQL(Efficient Quality Learning)与自训练(self-training)策略,以学习更具泛化能力的特征表示;在第二阶段,采用Balanced GroupSoftmax优化分类器,并提出一种新颖的候选框分配策略以及一种新的平衡掩码损失函数(balanced mask loss),以提升掩码头的预测精度。最终,该方法在LVIS v1.0验证集和测试开发集上分别取得了41.5和41.2的AP(Average Precision)成绩,显著优于基于X101-FPN-MaskRCNN的基线模型。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| instance-segmentation-on-lvis-v1-0-test-dev | R50-FPN-MaskRCNN-TTA | mask AP: 41.23 |