4 个月前

自监督协同训练在视频表征学习中的应用

自监督协同训练在视频表征学习中的应用

摘要

本文的目标是仅基于视觉的自监督视频表征学习。我们做出了以下贡献:(i) 我们研究了在实例级信息噪声对比估计(InfoNCE)训练中添加语义类别正样本的好处,结果表明这种形式的监督对比学习显著提升了性能;(ii) 我们提出了一种新颖的自监督协同训练方案,以改进广泛使用的InfoNCE损失函数,通过利用同一数据源的不同视图、RGB流和光流之间的互补信息,使用一个视图来为另一个视图获取正类样本;(iii) 我们对所学表征的质量进行了全面评估,涉及两个不同的下游任务:动作识别和视频检索。在这两个任务中,所提出的方法不仅展示了与现有自监督方法相当或更优的性能,而且在训练效率上显著提高,即需要远少的训练数据即可达到类似的性能水平。

代码仓库

TengdaHan/CoCLR
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
self-supervised-action-recognition-on-hmdb51CoCLR
Frozen: false
Top-1 Accuracy: 46.1
self-supervised-action-recognition-on-hmdb51-1CoCLR
Top-1 Accuracy: 54.6
self-supervised-action-recognition-on-ucf101CoCLR
3-fold Accuracy: 74.5
Frozen: false
self-supervised-action-recognition-on-ucf101-1CoCLR
3-fold Accuracy: 87.9
Pretrain: K400

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
自监督协同训练在视频表征学习中的应用 | 论文 | HyperAI超神经