arXiv ID:
2512.12623
arXiv 提交日期: 2025-12-14
思维内推理:潜在空间中的动态多模态交错 / Reasoning Within the Mind: Dynamic Multimodal Interleaving in Latent Space
1️⃣ 一句话总结
这篇论文提出了一种名为DMLR的新方法,它模仿人类思维中感知与推理动态交织的过程,在模型内部潜在空间中进行高效的视觉-文本信息融合,从而显著提升了多模态模型的推理能力和效率。