6 个月前

计算机视觉

Dongjun Kim Seungjae Shin Kyungwoo Song Wanmo Kang Il-Chul Moon

摘要

近年来，扩散模型在图像生成任务中取得了最先进的性能。然而，先前关于扩散模型的实证研究暗示，密度估计能力与样本生成性能之间存在一种负相关关系。本文通过充分的实证证据表明，这种负相关现象的根源在于：密度估计主要依赖于较小的扩散时间，而样本生成则主要依赖于较大的扩散时间。然而，在整个扩散时间范围内训练一个表现良好的得分网络（score network）极具挑战性，因为不同扩散时间步上的损失尺度存在显著不平衡。为实现有效训练，本文提出一种通用性强的训练技术——软截断（Soft Truncation），该方法将原本固定且静态的截断超参数转化为一个随机变量，从而缓解损失尺度不平衡的问题。在实验中，软截断方法在CIFAR-10、CelebA、CelebA-HQ 256×256以及STL-10等多个数据集上均取得了当前最先进的性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

Dongjun Kim Seungjae Shin Kyungwoo Song Wanmo Kang Il-Chul Moon

摘要

近年来，扩散模型在图像生成任务中取得了最先进的性能。然而，先前关于扩散模型的实证研究暗示，密度估计能力与样本生成性能之间存在一种负相关关系。本文通过充分的实证证据表明，这种负相关现象的根源在于：密度估计主要依赖于较小的扩散时间，而样本生成则主要依赖于较大的扩散时间。然而，在整个扩散时间范围内训练一个表现良好的得分网络（score network）极具挑战性，因为不同扩散时间步上的损失尺度存在显著不平衡。为实现有效训练，本文提出一种通用性强的训练技术——软截断（Soft Truncation），该方法将原本固定且静态的截断超参数转化为一个随机变量，从而缓解损失尺度不平衡的问题。在实验中，软截断方法在CIFAR-10、CelebA、CelebA-HQ 256×256以及STL-10等多个数据集上均取得了当前最先进的性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供