3 个月前

为非线性运动设计高效的物体追踪器

为非线性运动设计高效的物体追踪器

摘要

多目标跟踪的目标是在视频序列中检测并持续追踪场景中的所有物体,同时为每个物体维持唯一的标识符,这依赖于跨帧对检测到的边界框进行关联。这种关联通常基于物体运动模式与外观特征的匹配。然而,在涉及动态且非线性运动模式的场景中,该任务尤为困难。本文提出了一种新型、精心设计的多目标跟踪方法——DeepMoveSORT,专为应对此类复杂场景而开发。除了传统的基于外观的关联方法外,我们通过引入可学习的深度滤波器(替代广泛使用的卡尔曼滤波器)以及一系列新提出的启发式策略,显著提升了基于运动的关联性能。我们的改进主要体现在以下两个方面:首先,我们提出了一种基于Transformer的新型滤波器架构——TransFilter,该架构利用物体的运动历史实现运动预测与噪声滤波的双重功能。为进一步提升滤波器性能,我们对运动历史进行了精细化处理,并考虑了相机运动的影响。其次,我们设计了一组启发式规则,充分利用检测边界框的位置、形状和置信度等线索,以增强关联的准确性。实验评估表明,DeepMoveSORT在具有非线性运动特性的场景中显著优于现有跟踪器,在三个相关数据集上均取得了优于当前最先进方法的性能。此外,我们还进行了详尽的消融实验,系统评估了所提出各组件的贡献。研究结果表明,采用可学习滤波器替代传统卡尔曼滤波器,并结合基于外观的关联策略,是实现强大泛化跟踪性能的关键因素。

基准测试

基准方法指标
multi-object-tracking-on-dancetrackDeepMoveSORT
AssA: 48.6
DetA: 82.0
HOTA: 63.0
IDF1: 65.0
MOTA: 92.6
multi-object-tracking-on-sportsmotDeepMoveSORT
AssA: 70.3
DetA: 88.1
HOTA: 78.7
IDF1: 81.7
MOTA: 96.5
multiple-object-tracking-on-sportsmotDeepMoveSORT
AssA: 70.3
DetA: 88.1
HOTA: 78.7
IDF1: 81.7
MOTA: 96.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
为非线性运动设计高效的物体追踪器 | 论文 | HyperAI超神经