
摘要
当前流行的双流、两阶段跟踪框架分别提取模板和搜索区域的特征,然后进行关系建模,因此提取的特征缺乏目标意识,且目标与背景的区分能力有限。为了解决上述问题,我们提出了一种新颖的一流跟踪(OSTrack)框架,通过在模板-搜索图像对之间建立双向信息流,统一了特征学习和关系建模。这样,通过相互引导可以动态提取具有区分性的目标导向特征。由于不需要额外的重型关系建模模块且实现高度并行化,所提出的跟踪器运行速度较快。为了进一步提高推理效率,基于一流框架中计算的强大相似性先验,在网络内部提出了一个候选早期消除模块。作为统一框架,OSTrack在多个基准测试中实现了最先进的性能,特别是在单次跟踪基准GOT-10k上表现出色,即达到了73.7%的平均重叠率(AO),比现有的最佳结果(SwinTrack)提高了4.3%。此外,我们的方法在性能和速度之间保持了良好的平衡,并展示了更快的收敛速度。代码和模型可在https://github.com/botaoye/OSTrack获取。
代码仓库
botaoye/ostrack
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-tracking-on-coesot | OSTrack | Precision Rate: 66.6 Success Rate: 59.0 |
| video-object-tracking-on-nv-vot211 | OSTrack-384 | AUC: 38.59 Precision: 53.06 |
| visual-object-tracking-on-got-10k | OSTrack-384 | Average Overlap: 73.7 Success Rate 0.5: 83.2 Success Rate 0.75: 70.8 |
| visual-object-tracking-on-lasot | OSTrack-384 | AUC: 71.1 Normalized Precision: 81.1 Precision: 77.6 |
| visual-object-tracking-on-lasot-ext | OSTrack | AUC: 50.6 Normalized Precision: 61.3 Precision: 57.6 |
| visual-object-tracking-on-trackingnet | OSTrack-384 | Accuracy: 83.9 Normalized Precision: 88.5 Precision: 83.2 |
| visual-object-tracking-on-uav123 | OSTrack -384 | AUC: 0.707 |
| visual-tracking-on-tnl2k | OSTrack | AUC: 55.9 |