arXiv ID:
2603.25284
arXiv 提交日期: 2026-03-26
SliderQuant:面向大语言模型的精确训练后量化 / SliderQuant: Accurate Post-Training Quantization for LLMs
1️⃣ 一句话总结
本文提出了一种名为SliderQuant的新量化框架,它通过分析发现大语言模型不同层对量化的敏感度不同,并设计了一种自适应的滑动窗口量化方法,从而在多种任务和模型上显著降低了量化误差,效果优于现有方法。