arXiv ID:
2509.11177
arXiv 提交日期: 2025-09-14
大语言模型联合量化与稀疏化的最优大脑修复方法 / Optimal Brain Restoration for Joint Quantization and Sparsification of LLMs
1️⃣ 一句话总结
本文提出了一种名为‘最优大脑修复’的无训练框架,通过误差补偿协同解决大语言模型量化与稀疏化之间的技术冲突,在保持模型性能的同时实现了4.72倍加速和6.4倍内存压缩。