ArticleMetadataMain page

source · 2026-04-15

用于文本驱动图像编辑的 Prompt Tuning Inversion(ICCV 2023)

用于文本驱动图像编辑的 Prompt Tuning Inversion(ICCV 2023)

会议:ICCV 2023
发表日期:2023/05/08
资料加入日期:2026-04-14

一句话结论

这篇工作把 prompt tuning 接进 inversion 过程,补强了真实图像编辑里“如何更好进入可编辑空间”的另一条技术线。

问题定义

它要解决的是文本驱动图像编辑中,真实图像反演后仍可能不够好编辑、不够稳定的问题。对当前知识库来说,它补的是 inversion 机制进一步细化为 prompt tuning 路线的节点。

方法概述

Prompt Tuning Inversion 通过对 prompt 或相关条件进行调优,帮助真实图像在扩散模型中获得更适合后续文本编辑的可编辑表示。

关键发现

  • 它说明真实图像编辑并不是单靠一次反演就结束,而是可以围绕条件表示继续优化。
  • 它让 inversion 主线进一步分叉出 prompt-level 调整,而不只是 latent-level 反演。
  • 它与 NULL-Text Inversion、Effective Real Image Editing 一起,构成了 image-editing 近三年里很重要的机制改进簇。

局限或疑问

  • 这一路线更偏底层机制调优,对最终任务表达的帮助需要结合具体编辑任务看。
  • 它可能增加编辑链条的复杂度。
  • 它仍然属于扩散式真实图像编辑范式内部优化。

原始链接

  • https://arxiv.org/abs/2305.04441
  • https://arxiv.org/pdf/2305.04441

相关页面

备注

Prompt Tuning Inversion 在这套库里的意义,是把真实图像编辑里的 prompt-level inversion 改进补成独立节点。