4 个月前

ODTrack:用于视觉跟踪的在线密集时序标记学习

ODTrack:用于视觉跟踪的在线密集时序标记学习

摘要

在线上下文推理和连续视频帧之间的关联对于视觉跟踪中的实例感知至关重要。然而,大多数当前表现最佳的跟踪器仍然依赖于参考帧和搜索帧之间稀疏的时间关系,通过离线模式进行工作。因此,它们只能在每对图像内独立交互,并建立有限的时间相关性。为了解决上述问题,我们提出了一种简单、灵活且有效的视频级跟踪流水线,命名为ODTrack,该方法以在线令牌传播的方式密集地关联视频帧的上下文关系。ODTrack接收任意长度的视频帧,以捕捉实例的空间-时间轨迹关系,并将目标的判别特征(定位信息)压缩成一个令牌序列,实现帧间关联。这一新方案带来了以下好处:1) 纯净的令牌序列可以作为下一个视频帧推理的提示,从而利用过去的信息指导未来的推理;2) 通过令牌序列的迭代传播有效避免了复杂的在线更新策略,因此我们可以实现更高效模型表示和计算。ODTrack在七个基准测试中实现了新的最先进(SOTA)性能,同时运行速度达到实时水平。代码和模型可在\url{https://github.com/GXNU-ZhongLab/ODTrack}获取。

代码仓库

gxnu-zhonglab/odtrack
官方
pytorch
GitHub 中提及

基准测试

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
ODTrack:用于视觉跟踪的在线密集时序标记学习 | 论文 | HyperAI超神经