3 个月前

冷PAWS:无监督类别发现与半监督学习中的冷启动问题解决

冷PAWS:无监督类别发现与半监督学习中的冷启动问题解决

摘要

在众多机器学习应用中,数据集的标注往往是一项耗时且繁琐的任务。尽管已有研究表明,在计算机视觉领域,半监督学习技术仅需极少标注样本即可实现较高精度,但针对数据集中应如何选择图像进行标注的研究却相对较少。本文提出一种基于成熟自监督学习、聚类与流形学习技术的新型方法,旨在解决初始阶段如何选择具有信息量的图像子集进行标注这一挑战,即所谓的“冷启动”或“无监督选择性标注”问题。我们在多个公开可用的数据集(包括CIFAR10、Imagenette、DeepWeeds和EuroSAT)上验证了该方法的有效性,结果表明,相较于随机采样,采用本文提出的标签选择策略后,无论是监督学习还是半监督学习策略均取得了更优的性能表现。此外,与文献中其他方法相比,本方法在所考察数据集上以更为简洁的实现方式获得了更优越的性能。

基准测试

基准方法指标
semi-supervised-image-classification-coldSimCLR-kmediods-PAWS
Percentage error: 6.4
semi-supervised-image-classification-cold-2SimCLR-kmediods-PAWS
Percentage error: 6.1
semi-supervised-image-classification-cold-3SimCLR-kmediods-PAWS
Percentage error: 3.8
semi-supervised-image-classification-cold-4SimCLR-kmediods-PAWS
Percentage error: 10.8
semi-supervised-image-classification-cold-5SimCLR-kmediods-PAWS
Percentage error: 6.1
semi-supervised-image-classification-cold-6SimCLR-kmediods-PAWS
Percentage error: 2.6
semi-supervised-image-classification-cold-7SimCLR-kmediods-finetuned
Percentage error: 19.6
semi-supervised-image-classification-on-21SimCLR-kmediods-PAWS
Percentage error: 3.8
semi-supervised-image-classification-on-22SimCLR-kmediods-PAWS
Percentage error: 10.8
semi-supervised-image-classification-on-23SimCLR-kmediods-PAWS
Percentage error: 6.1
semi-supervised-image-classification-on-24SimCLR-kmediods-PAWS
Percentage error: 2.6
semi-supervised-image-classification-on-25SimCLR-kmediods-finetuned
Percentage error: 19.6
semi-supervised-image-classification-on-cifar-27SimCLR-kmediods-PAWS
Percentage error: 6.1
semi-supervised-image-classification-on-cifar-28SimCLR-kmediods-PAWS
Percentage error: 6.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
冷PAWS:无监督类别发现与半监督学习中的冷启动问题解决 | 论文 | HyperAI超神经