arXiv ID:
2606.10572
每项多模态证据仅用一个token:面向资源受限问答的隐式记忆 / One Token per Multimodal Evidence: Latent Memory for Resource-Constrained QA
1️⃣ 一句话总结
本文提出了一种名为“隐式记忆”的新方法,将每个文本或图像证据压缩成一个高维的“隐式token”,从而大幅降低大模型在问答任务中需要处理的数据量,在节省3到10倍计算资源的同时,仍能保持甚至提升答案的准确性。