4 个月前

在野外编辑文本

在野外编辑文本

摘要

本文关注在自然图像中编辑文本的问题,目标是在保持真实感的前提下替换或修改源图像中的某个单词。这一任务具有挑战性,因为需要同时保留背景和文本的风格,以确保编辑后的图像在视觉上与源图像无法区分。具体而言,我们提出了一种端到端可训练的风格保留网络(SRNet),该网络由三个模块组成:文本转换模块、背景修复模块和融合模块。文本转换模块将源图像中的文本内容更改为目标文本,同时保持原有的文本风格。背景修复模块擦除原始文本,并用适当的纹理填充文本区域。融合模块结合前两个模块的信息,生成编辑后的文本图像。据我们所知,这是首次尝试在自然图像中进行单词级别的文本编辑。我们在合成数据集和真实世界数据集(ICDAR 2013)上的实验结果从视觉效果和定量分析两方面充分证实了模块化分解的重要性和必要性。此外,我们还进行了广泛的实验,验证了我们的方法在各种实际应用中的有效性,例如文本图像合成、增强现实(AR)翻译、信息隐藏等。

代码仓库

Niwhskal/SRNet
pytorch
GitHub 中提及
youdao-ai/SRNet
tf
GitHub 中提及

基准测试

基准方法指标
image-inpainting-on-streetviewSRNet
SSIM: 0.79
image-to-image-translation-on-kitti-objectSRNet
Average PSNR: 21.12

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
在野外编辑文本 | 论文 | HyperAI超神经