ArticleMetadataMain page

source · 2026-04-16

Plug-and-Play Diffusion Features(CVPR 2023):把 diffusion feature 直接变成文本驱动图像翻译接口

Plug-and-Play Diffusion Features(CVPR 2023):把 diffusion feature 直接变成文本驱动图像翻译接口

会议:CVPR 2023
发表日期:2022/11/22
资料加入日期:2026-04-16

一句话结论

这篇工作把 diffusion feature 本身变成文本驱动图像翻译接口,说明 editing/control 不只靠外接 guidance 模块,也可以直接借用扩散过程中的内部特征。

问题定义

文本驱动图像到图像翻译需要既改语义又保结构。论文要解决的是,怎样直接利用 diffusion model 已有特征完成编辑,而不必为每种任务都重新训练一条完整生成链。

方法概述

作者把 diffusion features 作为可插拔的控制资源来用,让文本驱动图像翻译能够借到扩散过程中的内部表示。它的重要性在于把 plug-and-play 思想进一步从 guidance module 扩展到 feature layer。

关键发现

局限或疑问

  • 它更强调 feature reuse 与编辑接口,不直接回答部署压缩或大规模 few-step 加速。
  • feature-level plug-and-play 和 inversion-based 编辑之间的优先关系,还需要更多证据比较。

原始链接

  • https://arxiv.org/abs/2211.12572
  • https://arxiv.org/pdf/2211.12572.pdf

相关页面

备注

它在本库中的价值,是把插件化控制思路往 diffusion feature 层补进去,让后续 control engineering 的谱系更细。