视频编辑
概述
这一页聚焦视频编辑。当前批次里最重要的几条线索是:更精准的视频原生控制、利用视频扩散先验的免训练编辑、通过奖励调优改善编辑质量,以及把“视频编辑理解”本身纳入评测问题。整体来看,视频编辑不只是生成更像的视频,而是要同时兼顾指令遵循、时序一致性和未编辑区域的稳定保留。
当前综合判断
sources/2026-04-14-shape-aware-layered-video-editing、sources/2026-04-14-vive3d、sources/2026-04-14-fairy-video-to-video 和 sources/2026-04-14-flowvid 进一步把 layered control、3D-aware viewpoint consistency、高效 video-to-video 合成与 flow-guided consistency 这几条分支补厚了。
sources/2026-04-14-avid-video-inpainting、sources/2026-04-14-dynvideo-e 和 sources/2026-04-14-language-driven-video-inpainting 进一步说明,video-editing 还沿着长视频修补、3D/动态表示和语言驱动修补三条分支继续扩张。
sources/2026-04-14-stablevideo、sources/2026-04-14-pix2video 和 sources/2026-04-14-video-worth-256-bases 进一步把 video-editing 的一致性感知、图像扩散迁移和时空 inversion 三条早中期路线补厚了。
再补入 sources/2026-04-14-camel-video-editing、sources/2026-04-14-vidtome、sources/2026-04-14-motionfollower 和 sources/2026-04-14-reangle-a-video 后,可以看到 video-editing 近三年还在沿着 motion enhancement、token-merging efficiency、score-guided motion editing 和生成/翻译接口重写四条线持续加厚。
sources/2026-04-14-qk-edit、sources/2026-04-14-insvie-1m 和 sources/2026-04-14-veggie 进一步说明,video-editing 现在已经同时沿着新主干可编辑性、数据构造和 reasoning-grounded editing 三条线推进。
sources/2026-04-14-framepainter 与 sources/2026-04-14-dive-subject-driven-video-editing 进一步说明,video-editing 近三年还在沿着“图像/视频双向借模”和“主体驱动编辑”两条路线加深。
再补入 sources/2026-04-14-ccedit 和 sources/2026-04-14-maskint 后,这条线还多出了“创意且可控的视频编辑”与“masked transformer 对照路线”两种重要分化。
再加上 sources/2026-04-14-motioneditor 和 sources/2026-04-14-rave-video-editing,可以看到 2024 左右 video-editing 已明显分出“运动编辑专门化”和“高效一致编辑”两条工程化路线。
跨年份补强之后,这条线的前史与细粒度评测层都更完整了。新补入的 sources/2026-04-14-video-p2p 则把 Prompt-to-Prompt 式 cross-attention control 正式接进视频编辑历史链,说明早期 video-editing 的一条核心路线就是把图像编辑控制机制迁移到时序域。早期的 sources/2026-04-14-fatezero 说明 attention 控制和零样本注入很早就是视频编辑的重要方法起点;而新补入的 sources/2026-04-14-five-bench 则说明到 2025 阶段,video-editing 已经开始拥有更细粒度的专用 benchmark。现有 source 已经显示出四条主要路线。sources/2026-04-12-videodirector 代表视频原生反演与控制路线,强调编辑精度;sources/2026-04-12-fade 说明训练免费编辑在视频里依然有竞争力;sources/2026-04-12-align-a-video 把 reward tuning 引入视频编辑,强调主观偏好对齐与一致性保护;sources/2026-04-12-veu-bench 则把注意力拉回编辑理解评测;新补入的 sources/2026-04-14-aigv-assessor 则进一步说明,即使只看感知质量,AIGV 也需要比传统 VQA 更贴近人类判断的评测器。
方法家族
- 视频原生反演与控制:sources/2026-04-12-videodirector
- 训练免费视频编辑:sources/2026-04-12-fade
- 基于 reward tuning 的编辑:sources/2026-04-12-align-a-video
- 早期零样本 attention 编辑路线:sources/2026-04-14-fatezero
- cross-attention control 迁移路线:sources/2026-04-14-video-p2p
- 高效一致视频编辑路线:sources/2026-04-14-rave-video-editing
- 运动编辑专门化路线:sources/2026-04-14-motioneditor
- masked transformer 对照路线:sources/2026-04-14-maskint
- 主体驱动视频编辑路线:sources/2026-04-14-dive-subject-driven-video-editing
- 图像/视频双向借模路线:sources/2026-04-14-framepainter
- creative-control 平衡路线:sources/2026-04-14-ccedit
- reasoning-grounded 视频编辑:sources/2026-04-14-veggie
- 4D video-to-video 翻译路线:sources/2026-04-14-reangle-a-video
- 语言驱动视频修补:sources/2026-04-14-language-driven-video-inpainting
- flow-guided consistency 路线:sources/2026-04-14-flowvid
- 高效 video-to-video 合成:sources/2026-04-14-fairy-video-to-video
- 3D-aware 视角无关视频编辑:sources/2026-04-14-vive3d
- layered/compositional 视频编辑:sources/2026-04-14-shape-aware-layered-video-editing
- dynamic NeRF 人体视频编辑:sources/2026-04-14-dynvideo-e
- 任意长度视频修补:sources/2026-04-14-avid-video-inpainting
- 时空 EM inversion 路线:sources/2026-04-14-video-worth-256-bases
- 图像扩散迁移到视频编辑:sources/2026-04-14-pix2video
- consistency-aware 视频编辑:sources/2026-04-14-stablevideo
- score-guided motion editing:sources/2026-04-14-motionfollower
- token-merging 效率路线:sources/2026-04-14-vidtome
- 因果运动增强路线:sources/2026-04-14-camel-video-editing
- instruction-based 视频编辑数据构造:sources/2026-04-14-insvie-1m
- MM-DiT 时代的编辑注入路线:sources/2026-04-14-qk-edit
- 面向编辑理解的评测路线:sources/2026-04-12-veu-bench
- 面向细粒度视频编辑能力剖面的 benchmark:sources/2026-04-14-five-bench
- 面向人类对齐评测的路线:sources/2026-04-14-video-bench
- 面向草图控制的专门编辑/生成系统:sources/2026-04-14-sketchvideo
相关实体
- entities/video-editing-understanding 代表“视频编辑理解”这一评测与推理层,对判断编辑模型是否真正完成任务非常关键。
证据基础
- sources/2026-04-12-videodirector
- sources/2026-04-12-fade
- sources/2026-04-12-align-a-video
- sources/2026-04-12-veu-bench
- sources/2026-04-14-aigv-assessor
- sources/2026-04-14-sketchvideo
- sources/2026-04-14-video-bench
- sources/2026-04-14-fatezero
- sources/2026-04-14-five-bench
- sources/2026-04-14-video-p2p
- sources/2026-04-14-rave-video-editing
- sources/2026-04-14-motioneditor
- sources/2026-04-14-maskint
- sources/2026-04-14-dive-subject-driven-video-editing
- sources/2026-04-14-framepainter
- sources/2026-04-14-ccedit
- sources/2026-04-14-veggie
- sources/2026-04-14-reangle-a-video
- sources/2026-04-14-video-worth-256-bases
- sources/2026-04-14-language-driven-video-inpainting
- sources/2026-04-14-flowvid
- sources/2026-04-14-fairy-video-to-video
- sources/2026-04-14-vive3d
- sources/2026-04-14-shape-aware-layered-video-editing
- sources/2026-04-14-dynvideo-e
- sources/2026-04-14-avid-video-inpainting
- sources/2026-04-14-pix2video
- sources/2026-04-14-stablevideo
- sources/2026-04-14-motionfollower
- sources/2026-04-14-vidtome
- sources/2026-04-14-camel-video-editing
- sources/2026-04-14-insvie-1m
- sources/2026-04-14-qk-edit
后续值得追踪的问题
- questions/question-do-benchmarks-track-real-video-editing-understanding — 现有评测是否真的刻画了视频编辑理解能力。
- 视频原生 T2V 编辑器是否会明显优于图像编辑延伸路线?
- reward tuning 在什么条件下会比强训练免费方法更有效?
- 当前 benchmark 与真实用户满意度之间的关系到底有多强?