4 个月前

强迫症:使用条件扩散模型学习过拟合

强迫症:使用条件扩散模型学习过拟合

摘要

我们提出了一种动态模型,其中权重根据输入样本 ( x ) 进行调整,并通过在 ( x ) 及其标签 ( y ) 上对基础模型进行微调来学习这些权重。这种从输入样本到网络权重的映射关系由一个去噪扩散模型(denoising diffusion model)近似实现。我们所使用的扩散模型专注于修改基础模型的一个单层,并且该层的输入、激活和输出都作为条件输入。由于扩散模型具有随机性,多次初始化可以生成不同的网络,形成一个集成模型(ensemble),从而进一步提高性能。我们的实验表明,该方法在图像分类、3D重建、表格数据、语音分离和自然语言处理等多个领域具有广泛的应用前景。我们的代码已发布在 https://github.com/ShaharLutatiPersonal/OCD

代码仓库

shaharlutatipersonal/ocd
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
few-shot-text-classification-on-amazonSetFit + OCD
Accuracy: 0.41
few-shot-text-classification-on-average-onSetFit + OCD
Accuracy: 0.643
few-shot-text-classification-on-average-onT-few 3B
Accuracy: 0.633
few-shot-text-classification-on-average-onSetFit
Accuracy: 0.622
few-shot-text-classification-on-average-onSetFit + OCD(5)
Accuracy: 0.648
few-shot-text-classification-on-sst-5SetFit + OCD
Accuracy: 0.478
image-classification-on-tiny-imagenet-1DeiT-B/16-D + OCD
Validation Acc: 90.8%
image-classification-on-tiny-imagenet-1DeiT-B/16-D + OCD(5)
Validation Acc: 92.0%
speech-separation-on-libri5mixOCD
SI-SDRi: 13.4

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
强迫症:使用条件扩散模型学习过拟合 | 论文 | HyperAI超神经