arXiv ID:
2605.26460
arXiv 提交日期: 2026-05-26
AnchorDiff:基于锚点图传播的无训练概念定位方法用于多模态扩散Transformer / AnchorDiff: Training-Free Concept Grounding for MM-DiTs via Anchor-Based Graph Propagation
1️⃣ 一句话总结
本文提出了一种无需额外训练的方法AnchorDiff,通过先从注意力图中选出高置信度的锚点,再利用图传播技术将信息精确扩散到图像中的对应物体上,有效解决了多模态扩散模型在混淆概念上的错误激活问题。