arXiv ID:
2603.08065
面向大语言模型的确定性可微分结构化剪枝 / Deterministic Differentiable Structured Pruning for Large Language Models
1️⃣ 一句话总结
这篇论文提出了一种名为DDP的确定性可微分剪枝方法,它能更高效、更准确地压缩大语言模型的规模,在保证模型性能损失很小的同时,显著提升推理速度。