3 个月前

跨视图训练在半监督学习中的应用

跨视图训练在半监督学习中的应用

摘要

我们提出了一种名为跨视图训练(Cross-View Training, CVT)的简单而有效的深度半监督学习方法。在有标签样本上,模型采用标准的交叉熵损失进行训练;在无标签样本上,模型首先执行推理(作为“教师”)生成软标签(soft targets),随后模型再基于这些软标签进行学习(作为“学生”)。与以往工作不同的是,我们在模型中引入了多个辅助的学生预测层。每个学生层的输入是完整模型的一个子网络,该子网络对输入具有受限的“视图”(例如,仅能观察图像的某一个局部区域)。由于教师模型(即完整模型)能够看到每个样本的更多部分,因此学生模型可以从中学习;与此同时,随着学生模型在数据受限条件下不断学习预测,其也反过来提升了教师模型所使用表示的质量。当与虚拟对抗训练(Virtual Adversarial Training)结合使用时,CVT在半监督CIFAR-10和半监督SVHN任务上均超越了当前的最先进水平。此外,我们将CVT应用于五个自然语言处理任务,利用数亿条无标签语句进行模型训练。在所有任务中,CVT均显著优于仅依赖监督学习的方法,所得到的模型性能达到或超越当前最先进的水平。

基准测试

基准方法指标
chunking-on-conll-2000ELMo + Multi-Task
Exact Span F1: 96.83
chunking-on-conll-2000CVT+Multi-Task+Large
Exact Span F1: 96.98

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
跨视图训练在半监督学习中的应用 | 论文 | HyperAI超神经