arXiv ID:
2606.09659
arXiv 提交日期: 2026-06-08
端到端的大规模上下文压缩 / End-to-End Context Compression at Scale
1️⃣ 一句话总结
本论文提出了一种名为LCLM的新型编码器-解码器模型,能在不显著降低质量的前提下,将超长文本压缩为更短的潜在表示,从而大幅减少大语言模型推理时的内存占用,并实现了压缩速度、准确率和内存效率的最佳平衡。