3 个月前

扩散模型中的风格注入:一种无需训练的大型扩散模型风格迁移适应方法

扩散模型中的风格注入:一种无需训练的大型扩散模型风格迁移适应方法

摘要

尽管扩散模型展现出令人瞩目的生成能力,现有的基于扩散模型的风格迁移方法仍需在推理阶段进行优化(如风格的微调或文本反转),这一过程耗时较长,或无法充分利用大规模扩散模型的生成潜力。为解决上述问题,我们提出了一种基于预训练大规模扩散模型的新型艺术风格迁移方法,该方法无需任何额外优化。具体而言,我们借鉴交叉注意力机制的运作方式,通过操控自注意力层的特征,在生成过程中将内容图像的键(key)和值(value)替换为风格图像的键和值。该方法具有多项理想特性:1)通过将相似风格映射至相似图像块,有效保持内容结构;2)基于内容图像与风格图像之间局部纹理(如边缘)的相似性实现风格迁移。此外,我们引入查询保留(query preservation)机制与注意力温度缩放(attention temperature scaling)以缓解原始内容被破坏的问题,并采用初始潜在空间自适应实例归一化(initial latent Adaptive Instance Normalization, AdaIN)来解决风格迁移中色彩不协调的问题(即无法准确传递风格图像的色彩)。实验结果表明,所提出的方法在传统风格迁移与基于扩散模型的风格迁移基准测试中均显著优于现有最先进方法。

代码仓库

jiwoogit/StyleID
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
style-transfer-on-stylebenchStyleID
CLIP Score: 0.604

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
扩散模型中的风格注入:一种无需训练的大型扩散模型风格迁移适应方法 | 论文 | HyperAI超神经