Imagen Editor 与 EditBench：推进并评测文本引导图像修补

一句话结论

这篇工作把“编辑模型”和“编辑 benchmark”同时推进，说明图像编辑不只是方法问题，也已经进入系统化评测阶段。

问题定义

它要解决的是文本引导图像修补里两个核心问题：一是编辑结果如何既跟随文本又尽量保住原图细节；二是这类编辑能力到底应该如何稳定评测。对当前知识库来说，它同时补了 image-editing 方法线与 evaluation 评测线。

方法概述

作者在 Imagen 基础上微调出 Imagen Editor，用 object detector 产生训练时的修补 mask，并在级联扩散流程里继续保留原始高分辨率图像条件。同时提出 EditBench，用自然图像和生成图像上的对象、属性、场景编辑来系统评估文本引导图像修补。

关键发现

它说明高质量图像编辑早期就已经明显依赖“训练数据/训练协议 + 编辑评测设计”的联动，而不只是推理时的小技巧。
它把 EditBench 作为显式 benchmark 推上台面，说明图像编辑能力评估本身已经是独立问题。
它为后续统一生成-编辑系统提供了一个重要参照：不仅要会编辑，还要能被可重复地评测。

局限或疑问

它更偏向图像修补场景，不等于覆盖全部 instruction-based image editing。
评测主要围绕 text-guided inpainting，和更开放的多类型编辑任务仍有距离。
它是重要锚点，但还不能回答统一模型长期一定优于专用流水线。

原始链接

https://arxiv.org/abs/2212.06909
https://arxiv.org/pdf/2212.06909

备注

Imagen Editor / EditBench 在这套库里的价值，是把图像编辑主线中的“方法推进”和“专门 benchmark 建立”接到同一历史节点上。

元数据

{ "id": "2026-04-14-imagen-editor-editbench", "type": "source", "title": "Imagen Editor 与 EditBench（CVPR 2023）：推进并评测文本引导图像修补", "status": "reviewed", "created": "2026-04-14", "updated": "2026-04-15", "venue": "CVPR 2023", "ingested_at": "2026-04-14", "tags": [ "near-cvpr-2025", "image-editing", "evaluation", "benchmarking", "primary-source" ], "note_status": "reviewed", "source_type": "paper", "authors": [ "Wang, Su", "Saharia, Chitwan", "Montgomery, Ceslee", "Pont-Tuset, Jordi", "Noy, Shai", "Pellegrini, Stefano", "Onoe, Yasumasa", "Laszlo, Sarah", "Fleet, David J.", "Soricut, Radu", "Baldridge, Jason", "Norouzi, Mohammad", "Anderson, Peter", "Chan, William" ], "published_at": "2022-12-13", "canonical_links": [ "https://arxiv.org/abs/2212.06909", "https://arxiv.org/pdf/2212.06909" ], "raw_entry": "raw/ingest/2026-04-14-imagen-editor-editbench/", "topics": [ "topics/image-generation", "topics/image-editing", "topics/generative-model-evaluation" ], "entities": [ "entities/unified-image-generation-editing" ], "claims": [], "questions": [ "questions/question-will-unified-image-models-sustain-their-advantage" ] }

Imagen Editor 与 EditBench推进并评测文本引导图像修补