Imagen Editor 与 EditBench(CVPR 2023):推进并评测文本引导图像修补
会议:CVPR 2023
发表日期:2022-12-13
资料加入日期:2026-04-14
一句话结论
这篇工作把“编辑模型”和“编辑 benchmark”同时推进,说明图像编辑不只是方法问题,也已经进入系统化评测阶段。
问题定义
它要解决的是文本引导图像修补里两个核心问题:一是编辑结果如何既跟随文本又尽量保住原图细节;二是这类编辑能力到底应该如何稳定评测。对当前知识库来说,它同时补了 image-editing 方法线与 evaluation 评测线。
方法概述
作者在 Imagen 基础上微调出 Imagen Editor,用 object detector 产生训练时的修补 mask,并在级联扩散流程里继续保留原始高分辨率图像条件。同时提出 EditBench,用自然图像和生成图像上的对象、属性、场景编辑来系统评估文本引导图像修补。
关键发现
- 它说明高质量图像编辑早期就已经明显依赖“训练数据/训练协议 + 编辑评测设计”的联动,而不只是推理时的小技巧。
- 它把 EditBench 作为显式 benchmark 推上台面,说明图像编辑能力评估本身已经是独立问题。
- 它为后续统一生成-编辑系统提供了一个重要参照:不仅要会编辑,还要能被可重复地评测。
局限或疑问
- 它更偏向图像修补场景,不等于覆盖全部 instruction-based image editing。
- 评测主要围绕 text-guided inpainting,和更开放的多类型编辑任务仍有距离。
- 它是重要锚点,但还不能回答统一模型长期一定优于专用流水线。
原始链接
- https://arxiv.org/abs/2212.06909
- https://arxiv.org/pdf/2212.06909
相关页面
- topics/image-generation
- topics/image-editing
- topics/generative-model-evaluation
- entities/unified-image-generation-editing
- questions/question-will-unified-image-models-sustain-their-advantage
备注
Imagen Editor / EditBench 在这套库里的价值,是把图像编辑主线中的“方法推进”和“专门 benchmark 建立”接到同一历史节点上。