arXiv ID:
2604.26378
arXiv 提交日期: 2026-04-29
CoQuant:联合权重-激活子空间投影的混合精度大语言模型量化方法 / CoQuant: Joint Weight-Activation Subspace Projection for Mixed-Precision LLMs
1️⃣ 一句话总结
本文提出了一种名为CoQuant的新方法,通过同时考虑模型权重和激活值的噪声影响,智能地选择部分关键计算通道使用高精度,从而在保持大语言模型推理效果的同时大幅降低计算成本。