3 个月前

如何训练你的基于能量的模型进行回归

如何训练你的基于能量的模型进行回归

摘要

近年来,基于能量的模型(Energy-based Models, EBMs)在计算机视觉领域日益受到关注。尽管EBMs通常被用于生成式图像建模,但近期研究已将其拓展至回归任务,并在目标检测与视觉追踪等任务中取得了当前最优的性能表现。然而,EBMs的训练过程众所周知具有挑战性。尽管已有多种技术被探索用于生成建模,但将EBMs应用于回归任务仍是一个研究不足的问题。因此,目前尚不清楚如何对EBMs进行训练才能获得最佳的回归性能。为此,我们承担起对该问题进行首次系统性研究的任务。为此,我们提出了一种简单但极为有效的噪声对比估计(Noise Contrastive Estimation, NCE)的扩展方法,并在一维回归与目标检测任务上,将其性能与文献中六种主流方法进行了细致对比。实验结果表明,所提出的训练方法应被视为首选方案。此外,我们将该方法应用于视觉追踪任务,在五个公开数据集上均取得了当前最优的性能表现。尤为突出的是,我们的追踪器在LaSOT数据集上取得了63.7%的AUC指标,在TrackingNet数据集上达到78.7%的成功率(Success Rate)。相关代码已开源,地址为:https://github.com/fregu856/ebms_regression。

代码仓库

fregu856/ebms_regression
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
visual-object-tracking-on-lasotDiMP-NCE+
AUC: 63.7
visual-object-tracking-on-needforspeedDiMP-NCE+
AUC: 0.65
visual-object-tracking-on-otb-100DiMP-NCE+
AUC: 0.707
visual-object-tracking-on-trackingnetDiMP-NCE+
AUC: 0.787
Normalized Precision: 83.7
Precision: 73.7
Success Rate: 0.787
visual-object-tracking-on-uav123DiMP-NCE+
AUC: 0.672

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
如何训练你的基于能量的模型进行回归 | 论文 | HyperAI超神经