3 个月前

全局追踪Transformer

全局追踪Transformer

摘要

我们提出了一种基于Transformer的新型全局多目标跟踪架构。该网络以一段短时视频帧序列作为输入,能够生成所有目标的全局轨迹。其核心组件是一个全局跟踪Transformer,该模块在序列中所有帧的物体之间进行操作。Transformer对所有帧中的物体特征进行编码,并利用轨迹查询(trajectory queries)将这些特征聚类为完整的轨迹。轨迹查询源自单帧中的物体特征,能够自然地生成唯一且连续的轨迹。与需要中间两两匹配或组合关联的现有方法不同,我们的全局跟踪Transformer无需此类步骤,且可与目标检测器联合训练。在广泛使用的MOT17基准测试中,该方法取得了75.3的MOTA和59.1的HOTA,表现具有竞争力。更重要的是,本框架可无缝集成至当前先进的大词汇量检测器中,实现对任意类别的物体进行跟踪。在具有挑战性的TAO数据集上的实验表明,我们的方法在基于两两关联的基线模型上持续取得提升,跟踪mAP指标显著优于已有研究成果,提升达7.7个百分点。代码已开源,地址为:https://github.com/xingyizhou/GTR。

代码仓库

xingyizhou/GTR
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
multi-object-tracking-on-mot17GTR
HOTA: 59.1
IDF1: 71.5
MOTA: 75.3
multi-object-tracking-on-sportsmotGTR
AssA: 45.9
DetA: 64.8
HOTA: 54.5
IDF1: 55.8
MOTA: 67.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
全局追踪Transformer | 论文 | HyperAI超神经