
摘要
从单张RGB图像中推断物体的6自由度(6DoF)位姿是一项重要但极具挑战性的任务,尤其是在严重遮挡的情况下。尽管近期方法通过构建端到端的流水线对两阶段方法进行了改进,但这些方法并未充分利用局部与全局约束信息。本文提出了一种成对特征提取(pairwise feature extraction)方法,以整合局部约束;同时引入三元组正则化(triplet regularization)来融合全局约束,从而提升6DoF物体位姿估计的精度。结合更优的数据增强策略,本方法在具有挑战性的遮挡Linemod数据集上取得了当前最优性能,相较于此前的最先进方法提升了9%;同时在标准Linemod数据集上也取得了具有竞争力的结果。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 6d-pose-estimation-on-linemod | E2E6DoF | Mean ADD: 86.8 |
| 6d-pose-estimation-using-rgb-on-occlusion | E2E6DoF | Mean ADD: 47.4 |