arXiv ID:
2602.09169
arXiv 提交日期: 2026-02-09
少训练,快推理:通过结构化稀疏性实现高效模型微调与压缩 / Train Less, Infer Faster: Efficient Model Finetuning and Compression via Structured Sparsity
1️⃣ 一句话总结
这篇论文提出了一种通过结构化稀疏化来微调大语言模型的新方法,它无需大量调整权重,只需训练极少的参数就能让模型适应新任务,同时还能减少模型体积、加快推理速度,并且性能优于现有的主流微调技术。