4 个月前

基于图像修复的视觉提示

基于图像修复的视觉提示

摘要

如何在无需针对特定任务进行微调或任何模型修改的情况下,将预训练的视觉模型适应于新的下游任务?受自然语言处理(NLP)中提示技术的启发,本文研究了视觉提示技术:在测试时给定新任务的输入-输出图像示例以及一个新的输入图像,目标是自动生成与给定示例一致的输出图像。我们发现,将这一问题表述为简单的图像修复——即在拼接的视觉提示图像中填补一个空白区域——结果出乎意料地有效,前提是图像修复算法已经使用了正确的数据进行训练。我们在一个新数据集上训练了掩码自编码器,该数据集由我们整理的88,000张来自Arxiv学术论文源的未标记图组成。我们将视觉提示技术应用于这些预训练模型,并展示了其在多种下游图像到图像任务中的效果,包括前景分割、单对象检测、着色、边缘检测等。

代码仓库

基准测试

基准方法指标
personalized-segmentation-on-persegVisual Prompting
mIoU: 65.88

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于图像修复的视觉提示 | 论文 | HyperAI超神经