4 个月前

iColoriT: 通过利用视觉变换器在交互式着色中将局部提示传播到正确区域

iColoriT: 通过利用视觉变换器在交互式着色中将局部提示传播到正确区域

摘要

点交互式图像着色旨在当用户为特定位置提供颜色时对灰度图像进行着色。对于点交互式着色方法而言,关键在于合理地在整个图像中传播用户提供的颜色(即用户提示),以最少的用户努力获得合理的着色效果。然而,现有的方法由于卷积层堆叠设计的效率低下,往往只能产生部分着色的结果,无法有效地将提示传播到远处的相关区域。为了解决这一问题,我们提出了一种新的点交互式着色视觉变换器——iColoriT,该模型能够利用Transformer的全局感受野来传播用户提示至相关区域。Transformer的自注意力机制使得iColoriT仅需少数局部提示即可选择性地对相关区域进行着色。我们的方法通过使用像素洗牌技术(一种高效的上采样技术)替代解码器架构,实现了实时图像着色。此外,为了减轻大上采样比例下像素洗牌引起的伪影问题,我们引入了局部稳定层。大量的定量和定性结果表明,我们的方法在点交互式图像着色方面显著优于现有方法,能够在用户付出最小努力的情况下生成准确的着色图像。官方代码可在以下链接获取:https://pmh9960.github.io/research/iColoriT

代码仓库

pmh9960/iColoriT
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
point-interactive-image-colorization-oniColoriT
PSNR@1: 27.474
PSNR@10: 30.626
PSNR@100: 33.787
point-interactive-image-colorization-on-1iColoriT
PSNR@1: 22.925
PSNR@10: 27.37
PSNR@100: 30.731
point-interactive-image-colorization-on-1SWF
PSNR@1: 18.452
PSNR@10: 19.445
PSNR@100: 22.362
point-interactive-image-colorization-on-1InstColor
PSNR@1: 22.97
PSNR@100: 27.35
point-interactive-image-colorization-on-1iDeepColor
PSNR@1: 22.72
PSNR@10: 25.13
PSNR@100: 27.826
point-interactive-image-colorization-on-cubiColoriT
PSNR@1: 27.986
PSNR@10: 30.595
PSNR@100: 33.543
point-interactive-image-colorization-on-cubInstColor
PSNR@1: 27.69
PSNR@10: 29.45
PSNR@100: 31.45
point-interactive-image-colorization-on-cubSWF
PSNR@1: 23.547
PSNR@10: 25.097
PSNR@100: 27.623
point-interactive-image-colorization-on-cubiDeepColor
PSNR@1: 27.45
PSNR@10: 29.32
PSNR@100: 31.57

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
iColoriT: 通过利用视觉变换器在交互式着色中将局部提示传播到正确区域 | 论文 | HyperAI超神经