🤖 系统
11-30 17:32
📄 论文总结
大语言模型联合量化与稀疏化的最优大脑修复方法 / Optimal Brain Restoration for Joint Quantization and Sparsification of LLMs
1️⃣ 一句话总结
本文提出了一种名为‘最优大脑修复’的无训练框架,通过误差补偿协同解决大语言模型量化与稀疏化之间的技术冲突,在保持模型性能的同时实现了4.72倍加速和6.4倍内存压缩。
请先 登录 后再提交论文
大语言模型联合量化与稀疏化的最优大脑修复方法 / Optimal Brain Restoration for Joint Quantization and Sparsification of LLMs
本文提出了一种名为‘最优大脑修复’的无训练框架,通过误差补偿协同解决大语言模型量化与稀疏化之间的技术冲突,在保持模型性能的同时实现了4.72倍加速和6.4倍内存压缩。