arXiv ID:
2603.21576
arXiv 提交日期: 2026-03-23
PRISM:通过O(1)光子块选择打破长上下文LLM推理中的O(n)内存墙 / PRISM: Breaking the O(n) Memory Wall in Long-Context LLM Inference via O(1) Photonic Block Selection
1️⃣ 一句话总结
这篇论文提出了一种名为PRISM的光子计算硬件方案,它通过一种创新的光信号处理方式,在几乎不消耗额外能量的情况下,快速从海量历史对话信息中筛选出最相关的部分,从而从根本上解决了大模型处理长文本时因内存访问瓶颈导致的效率低下和能耗过高的问题。