3 个月前

基于自回归查询的时空Transformer自适应追踪

基于自回归查询的时空Transformer自适应追踪

摘要

丰富的时空信息对于捕捉视觉跟踪中目标外观的复杂变化至关重要。然而,大多数表现优异的跟踪算法依赖大量手工设计的组件来聚合时空信息,导致时空信息尚未得到充分挖掘。为缓解这一问题,我们提出一种基于时空变换器的自适应跟踪器(命名为AQATrack),该方法采用简洁的自回归查询机制,无需依赖大量人工设计的组件,即可有效学习时空信息。首先,我们引入一组可学习的自回归查询,以滑动窗口的方式捕捉目标在瞬时状态下的外观变化。其次,设计了一种新颖的注意力机制,用于现有查询之间的交互,以生成当前帧的新查询。最后,基于初始目标模板和学习得到的自回归查询,构建了一个时空信息融合模块(STM),用于实现时空特征的聚合,从而精确定位目标物体。得益于STM模块,我们能够有效结合目标的静态外观特征与瞬时变化信息,从而引导鲁棒的跟踪过程。大量实验表明,所提方法在六个主流跟踪基准数据集(LaSOT、LaSOText、TrackingNet、GOT-10k、TNL2K和UAV123)上均显著提升了跟踪性能。

基准测试

基准方法指标
visual-object-tracking-on-didiAQATrack
Tracking quality: 0.535

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于自回归查询的时空Transformer自适应追踪 | 论文 | HyperAI超神经