4 个月前

InstantID:秒级无样本身份保持生成

InstantID:秒级无样本身份保持生成

摘要

在个性化图像合成领域,诸如文本反转(Textual Inversion)、DreamBooth 和 LoRA 等方法已经取得了显著进展。然而,这些方法的实际应用受到高存储需求、漫长的微调过程以及需要多个参考图像的限制。相反,现有的基于身份嵌入的方法虽然只需要一次前向推理,但也面临一些挑战:它们要么需要对大量模型参数进行广泛的微调,要么与社区预训练模型不兼容,或者无法保持高面部保真度。为了解决这些问题,我们提出了一种强大的基于扩散模型的解决方案——InstantID。我们的即插即用模块能够仅使用一张面部图像,在多种风格下高效处理图像个性化问题,同时确保高保真度。为此,我们设计了一种新颖的 IdentityNet,通过施加强语义和弱空间条件,将面部图像和地标图像与文本提示相结合以引导图像生成。InstantID 展现了卓越的性能和效率,在实际应用中特别是在需要高度身份保留的情况下表现出色。此外,我们的工作可以无缝集成到流行的预训练文本到图像扩散模型如 SD1.5 和 SDXL 中,作为可适应的插件。我们的代码和预训练检查点将在 https://github.com/InstantID/InstantID 上提供。

代码仓库

instantx-research/instantid
pytorch
GitHub 中提及
TheDenk/InstantID-Visual-Prompt
pytorch
GitHub 中提及
instantid/instantid
官方
pytorch
GitHub 中提及
instantstyle/instantstyle
pytorch
GitHub 中提及

基准测试

基准方法指标
diffusion-personalization-tuning-free-onInstantID
Cosine Similarity: 0.713
FID: 18.598
LPIPS: 0.437

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
InstantID:秒级无样本身份保持生成 | 论文 | HyperAI超神经