arXiv ID:
2605.18475
arXiv 提交日期: 2026-05-18
GAMMA:面向任意预算下的混合精度模型的全局位宽分配方法 / GAMMA: Global Bit Allocation for Mixed-Precision Models under Arbitrary Budgets
1️⃣ 一句话总结
本文提出一种名为GAMMA的框架,能在不重新训练大模型的情况下,自动为不同模块分配最合适的精度(位宽),从而在给定的内存预算下最大化模型性能,并且一次学习即可快速适配多种部署场景。