
摘要
视觉目标跟踪通常通过独立地结合快速处理算法、高精度在线自适应方法以及多跟踪器融合策略来解决。本文提出了一种新颖的跟踪方法,将上述目标统一起来,该方法能够利用其他视觉跟踪器的离线与在线信息。通过知识蒸馏与强化学习的结合,训练出一个紧凑的学生模型:前者实现对其他跟踪器跟踪知识的迁移与压缩,后者则使模型能够学习并掌握可用于在线评估的度量指标。经过训练后,该学生模型可最终用于构建三类跟踪器:(i)一种极快的单次检测跟踪器;(ii)具备简单而高效在线自适应机制的跟踪器;(iii)能够融合其他跟踪器优势的集成式跟踪器。大量实验验证表明,所提出的算法在性能上可与当前实时状态最先进(SOTA)的跟踪器相媲美。
代码仓库
dontfollowmeimcrazy/vot-kd-rl
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| video-object-tracking-on-nv-vot211 | TRAS | AUC: 23.58 Precision: 30.64 |
| visual-object-tracking-on-got-10k | TRASFUST | Average Overlap: 61.7 Success Rate 0.5: 72.9 |
| visual-object-tracking-on-lasot | TRASFUST | AUC: 57.6 |
| visual-object-tracking-on-otb-2015 | TRASFUST | AUC: 0.701 Precision: 0.931 |
| visual-object-tracking-on-uav123 | TRASFUST | AUC: 0.679 Precision: 0.873 |