arXiv ID:
2605.26628
arXiv 提交日期: 2026-05-26
尾感知HiFloat4:面向Wan2.2的W4A4训练后量化方法 / Tail-Aware HiFloat4: W4A4 Post-Training Quantization for Wan2.2
1️⃣ 一句话总结
该论文提出了一种针对Wan2.2文本转视频模型的低比特量化方案,通过引入尾感知的百分位校准模块和边界高精度保留策略,在将模型权重和激活值压缩至4位精度的同时,有效抑制了罕见校准异常值的影响,保持了推理效率。