4 个月前

开放世界半监督学习

开放世界半监督学习

摘要

在现实世界中应用半监督学习的一个基本限制是假设未标记的测试数据仅包含之前在已标记的训练数据中遇到过的类别。然而,对于野外数据(data in-the-wild),这一假设很少成立,因为属于新类别的实例可能在测试时出现。本文引入了一种新的开放世界半监督学习设置,该设置形式化了未标记测试数据中可能出现新类别的概念。在这种新的设置下,目标是解决已标记数据和未标记数据之间的类别分布不匹配问题,在测试时每个输入实例要么需要被分类到现有的某个类别中,要么需要初始化一个新的未见过的类别。为了解决这一具有挑战性的问题,我们提出了ORCA,一种端到端的深度学习方法,通过引入不确定性自适应边界机制来规避因学习已见类别特征的速度快于新类别特征而导致的偏向已见类别的偏差。通过这种方式,ORCA 减小了已见类别与新类别之间的类内方差差距。图像分类数据集和单细胞注释数据集上的实验表明,ORCA 一致优于其他基线方法,在ImageNet 数据集上对已见类别的性能提升了25%,对新类别的性能提升了96%。

代码仓库

snap-stanford/orca
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
novel-object-detection-on-lvis-v1-0-valORCA Cao et al. (2022)
All mAP: 2.03
Known mAP: 20.57
Novel mAP: 0.49
open-world-semi-supervised-learning-on-1ORCA (ResNet-50)
All accuracy (10% Labeled): 69.7
All accuracy (50% Labeled): 77.8
Novel accuracy (10% Labeled): 60.5
Novel accuracy (50% Labeled): 72.1
Seen accuracy (10% Labeled): 83.9
Seen accuracy (50% Labeled): 89.1
open-world-semi-supervised-learning-on-cifarORCA (ResNet-18)
All accuracy (10% Labeled): 84.1
All accuracy (50% Labeled): 89.7
Novel accuracy (10% Labeled): 85.5
Novel accuracy (50% Labeled): 90.4
Seen accuracy (10% Labeled): 82.8
Seen accuracy (50% Labeled): 88.2
open-world-semi-supervised-learning-on-cifar-1ORCA (ResNet-18)
All accuracy (10% Labeled): 38.6
All accuracy (50% Labeled): 48.1
Novel accuracy (10% Labeled): 31.8
Novel accuracy (50% Labeled): 43.0
Seen accuracy (10% Labeled): 52.5
Seen accuracy (50% Labeled): 66.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
开放世界半监督学习 | 论文 | HyperAI超神经