4 个月前

RFSR:通过奖励反馈学习改进ISR扩散模型

RFSR:通过奖励反馈学习改进ISR扩散模型

摘要

生成扩散模型(DM)在图像超分辨率(ISR)领域得到了广泛应用。现有的大多数方法采用来自去噪扩散概率模型(DDPM)的去噪损失进行模型优化。我们认为,通过引入奖励反馈学习来微调现有模型可以进一步提高生成图像的质量。在本文中,我们提出了一种带有奖励反馈学习的时间步长感知训练策略。具体而言,在ISR扩散的初始去噪阶段,我们对超分辨率(SR)图像施加低频约束以保持结构稳定性;在后续的去噪阶段,我们利用奖励反馈学习来提升SR图像的感知质量和美学效果。此外,我们引入了Gram-KL正则化来缓解由奖励劫持引起的风格化问题。我们的方法可以以即插即用的方式集成到任何基于扩散的ISR模型中。实验结果表明,当使用我们的方法进行微调时,ISR扩散模型显著提升了SR图像的感知和美学质量,取得了优异的主观评价结果。代码:https://github.com/sxpro/RFSR

代码仓库

sxpro/rfsr
官方
pytorch

基准测试

基准方法指标
blind-super-resolution-on-drealsrSeeSR+RFSR
clipiqa: 0.7596
maniqa: 0.5922
musiq: 67.48

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
RFSR:通过奖励反馈学习改进ISR扩散模型 | 论文 | HyperAI超神经