arXiv ID:
2601.07287
焦点引导:从视频扩散模型的语义薄弱层中解锁可控性 / Focal Guidance: Unlocking Controllability from Semantic-Weak Layers in Video Diffusion Models
1️⃣ 一句话总结
这项研究提出了一种名为‘焦点引导’的新方法,通过识别并强化视频生成模型中那些对文字指令响应较弱的‘语义薄弱层’,有效提升了模型根据文字描述生成视频的准确性和可控性。