3 个月前

利用无约束未标记数据进行半监督学习的扩展

利用无约束未标记数据进行半监督学习的扩展

摘要

我们提出了一种名为UnMixMatch的半监督学习框架,该框架能够从无约束的未标注数据中学习到有效的特征表示,从而实现性能的可扩展提升。现有的大多数半监督学习方法均依赖于一个关键假设:标注样本与未标注样本来自同一分布,这一假设限制了利用自由获取的未标注数据所带来的性能提升潜力。因此,该假设在很大程度上制约了半监督学习方法的泛化能力与可扩展性。为克服上述局限,本方法旨在有效利用无约束的未标注数据,提升半监督学习的性能。UnMixMatch由三个核心组件构成:一是采用强数据增强策略的监督学习器,提供强有力的正则化;二是对比一致性正则化项,用于从未标注数据中学习深层的潜在表示;三是自监督损失函数,用于进一步增强从未标注数据中学习到的特征表示。我们在4个常用的基准数据集上进行了广泛的实验,结果表明,与现有半监督方法相比,UnMixMatch在性能上实现了显著提升,平均性能提升达4.79%。此外,通过系统的消融实验与敏感性分析,充分验证了所提出各组件的有效性及其对整体性能的贡献。

代码仓库

shuvenduroy/unmixmatch
官方
pytorch
GitHub 中提及

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
利用无约束未标记数据进行半监督学习的扩展 | 论文 | HyperAI超神经