arXiv ID:
2601.06803
arXiv 提交日期: 2026-01-11
先见森林后见树:用于高效视觉推理的潜在叠加 / Forest Before Trees: Latent Superposition for Efficient Visual Reasoning
1️⃣ 一句话总结
这篇论文提出了一种名为Laser的新方法,它通过让模型先在脑海里形成对图像的整体理解(‘森林’),再逐步聚焦到局部细节(‘树木’),从而在保持高准确率的同时,极大地提升了视觉推理的效率和泛化能力。