
摘要
多视图聚合有望克服多目标检测与跟踪中的遮挡和漏检问题。近年来,多视图检测和三维物体检测方法通过将所有视图投影到地面平面并在鸟瞰图(BEV)中进行检测,实现了性能的巨大飞跃。本文探讨了在鸟瞰图中进行跟踪是否也能为多目标多摄像机(MTMC)跟踪带来下一次性能突破。目前大多数多视图跟踪方法在每个视图中分别执行检测和跟踪任务,并采用基于图的方法来实现行人跨视图的关联。这种空间关联问题已经可以通过在鸟瞰图中对每个行人进行一次检测而得到解决,剩下的只有时间关联问题。对于时间关联,我们展示了如何为每次检测学习强大的再识别(re-ID)特征。实验结果表明,鸟瞰图中的早期融合在检测和跟踪方面均能达到高精度。EarlyBird 方法超越了现有最先进方法,并将 Wildtrack 数据集上的当前最先进水平提高了 +4.6 MOTA 和 +5.6 IDF1。
代码仓库
tteepe/EarlyBird
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| multi-object-tracking-on-multiviewx | EarlyBird | IDF1: 82.4 MOTA: 88.4 |
| multi-object-tracking-on-wildtrack | EarlyBird | IDF1: 92.3 MOTA: 89.5 |
| multiview-detection-on-multiviewx | EarlyBird | MODA: 94.2 MODP: 90.1 |
| multiview-detection-on-wildtrack | EarlyBird | MODA: 91.2 MODP: 81.8 |