arXiv ID:
2604.19351
arXiv 提交日期: 2026-04-21
DASH-KV:通过非对称KV缓存哈希加速长上下文大模型推理 / DASH-KV: Accelerating Long-Context LLM Inference via Asymmetric KV Cache Hashing
1️⃣ 一句话总结
DASH-KV提出了一种利用非对称深度哈希技术将注意力计算转化为近似最近邻搜索的新方法,在长文本推理中实现了线性复杂度,在保持生成质量的同时大幅降低了计算开销。