Check, Locate, Rectify：文本到图像生成的训练免费布局校准系统

一句话结论

这篇工作把训练免费的布局校准系统补进库里，强化了 image-generation 中的 layout control / calibration 路线。

问题定义

它要解决的是文本到图像生成即使有布局条件，仍可能放错位置或结构不稳的问题。对当前知识库来说，它补的是 LayoutDiffusion 之外更偏 inference-time calibration 的路线。

方法概述

Check, Locate, Rectify 提供 training-free layout calibration system，通过检测、定位和校正步骤提升 text-to-image generation 的布局遵循能力。

关键发现

它说明布局控制不仅可以在训练阶段建模，也可以在推理阶段做校准。
它让 image-generation 的空间控制路线从 layout modeling 扩到 layout calibration。
它对以后做低成本控制增强方向很有价值。

局限或疑问

训练免费系统通常更依赖基础模型已有能力。
它更偏布局校正，不直接等于更强开放语义生成。
它是控制增强路线，而不是基础模型路线。

原始链接

https://arxiv.org/abs/2311.15773
https://arxiv.org/pdf/2311.15773

备注

这篇工作在库里的作用，是把 layout calibration 路线补成 image-generation 控制层的重要分支。

元数据

{ "id": "2026-04-14-check-locate-rectify", "type": "source", "title": "Check, Locate, Rectify（CVPR 2024）：文本到图像生成的训练免费布局校准系统", "status": "reviewed", "created": "2026-04-14", "updated": "2026-04-15", "venue": "CVPR 2024", "ingested_at": "2026-04-14", "tags": [ "near-cvpr-2025", "image-generation", "control", "primary-source" ], "note_status": "reviewed", "source_type": "paper", "authors": [ "Gong, Biao", "Huang, Siteng", "Feng, Yutong", "Zhang, Shiwei", "Li, Yuyuan", "Liu, Yu" ], "published_at": "2023/11/27", "canonical_links": [ "https://arxiv.org/abs/2311.15773", "https://arxiv.org/pdf/2311.15773" ], "raw_entry": "raw/ingest/2026-04-14-check-locate-rectify/", "topics": [ "topics/image-generation", "topics/vision-language" ], "entities": [ "entities/unified-image-generation-editing" ], "claims": [], "questions": [ "questions/question-will-unified-image-models-sustain-their-advantage" ] }

Check, Locate, Rectify文本到图像生成的训练免费布局校准系统