4 个月前

基于多模态互促学习的RGB-T跟踪

基于多模态互促学习的RGB-T跟踪

摘要

基于可见光和热红外图像融合的目标跟踪,即RGB-T跟踪,在近年来受到了研究人员越来越多的关注。如何以更低的计算成本实现两种模态信息的更全面融合,一直是研究人员探索的问题。最近,随着计算机视觉领域提示学习(Prompt Learning)的兴起,我们可以更好地将大型视觉模型的知识迁移到下游任务中。考虑到可见光和热红外模态之间的强互补性,我们提出了一种基于两种模态之间相互提示学习的跟踪架构。此外,我们设计了一种轻量级提示器,该提示器在两个维度上结合了注意力机制,以较低的计算成本将信息从一种模态传递到另一种模态,并将其嵌入到骨干网络的每一层中。大量实验表明,我们提出的跟踪架构不仅有效而且高效,在保持高运行速度的同时达到了最先进的性能。

代码仓库

husteryoung/mplt
官方
pytorch

基准测试

基准方法指标
rgb-t-tracking-on-lasherMPLT
Precision: 72.0
Success: 57.1
rgb-t-tracking-on-rgbt210MPLT
Precision: 86.2
Success: 63.0
rgb-t-tracking-on-rgbt234MPLT
Precision: 88.4
Success: 65.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于多模态互促学习的RGB-T跟踪 | 论文 | HyperAI超神经