arXiv ID:
2604.04701
arXiv 提交日期: 2026-04-06
MUXQ:通过低秩异常值分解实现混合到均匀精度的矩阵量化 / MUXQ: Mixed-to-Uniform Precision MatriX Quantization via Low-Rank Outlier Decomposition
1️⃣ 一句话总结
这篇论文提出了一种名为MUXQ的新方法,通过识别并重新分配神经网络激活值中的极端异常数据,成功地将大语言模型的权重和激活值都压缩到低精度整数格式,从而在保持高精度的同时,大幅降低了模型在手机等边缘设备上运行所需的内存和计算开销。