← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: systems
详细标签: model compression quantization sparsification llm optimization hessian approximation 或 搜索:

📄 论文总结

最优大脑恢复:联合量化与稀疏化的大语言模型压缩框架

Optimal Brain Restoration: A Unified Framework for Joint Quantization and Sparsification of Large Language Models


1️⃣ 一句话总结

该论文提出了OBR框架,通过误差补偿机制协调量化与稀疏化的权重分布冲突,首次实现了LLMs的INT4量化和50%稀疏化联合压缩,在保持性能接近全精度模型的同时显著提升推理速度和减少内存占用。


2️⃣ 论文创新点

1. OBR统一框架

2. 分组误差补偿机制

3. 硬件友好稀疏模式支持


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF