arXiv ID:
2603.04956
arXiv 提交日期: 2026-03-05
WaterSIC:一种信息论上(接近)最优的线性层量化方法 / WaterSIC: information-theoretically (near) optimal linear layer quantization
1️⃣ 一句话总结
本文提出了一种名为WaterSIC的新算法,它通过为神经网络线性层权重矩阵的不同列分配不同的量化比特数,在信息论上实现了接近最优的模型压缩,显著提升了大型语言模型在1到4比特低精度量化下的性能。