3 个月前

RPT:用于孪生视觉跟踪的点集表示学习

RPT:用于孪生视觉跟踪的点集表示学习

摘要

尽管在鲁棒视觉跟踪领域已取得显著进展,但精确的目标状态估计仍是极具挑战性的问题。本文认为,这一难题与当前广泛采用的边界框(bounding box)表示方式密切相关,因为边界框仅能提供目标物体粗略的空间范围。为此,本文提出一种高效的视觉跟踪框架,采用一组代表性点作为更精细的表示方式,以实现对目标状态的精确估计。该点集经过训练,能够准确指示目标区域在语义和几何意义上的关键位置,从而实现更精细的定位与目标外观建模。此外,本文进一步提出一种多层级聚合策略,通过融合不同层级的卷积特征层,有效获取目标的详细结构信息。在OTB2015、VOT2018、VOT2019和GOT-10k等多个具有挑战性的基准数据集上的大量实验表明,所提方法在实现超过20 FPS实时运行速度的同时,达到了新的最先进性能。

基准测试

基准方法指标
semi-supervised-video-object-segmentation-on-15RPT
EAO: 0.530
EAO (real-time): 0.290

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
RPT:用于孪生视觉跟踪的点集表示学习 | 论文 | HyperAI超神经