arXiv ID:
2602.02001
arXiv 提交日期: 2026-02-02
先保留再量化:在大型语言模型的量化误差重建中平衡秩预算 / Preserve-Then-Quantize: Balancing Rank Budgets for Quantization Error Reconstruction in LLMs
1️⃣ 一句话总结
这篇论文提出了一种名为‘结构化残差重建’的新方法,它先保护权重矩阵中最重要的部分不被量化破坏,再用剩下的计算资源去修复量化带来的误差,从而在压缩大型语言模型时更好地保持其性能,并提升后续微调的效果。