arXiv ID:
2602.02680
arXiv 提交日期: 2026-02-02
FlexRank:用于自适应模型部署的嵌套低秩知识分解 / FlexRank: Nested Low-Rank Knowledge Decomposition for Adaptive Model Deployment
1️⃣ 一句话总结
这篇论文提出了一种名为FlexRank的方法,它通过从预训练好的大模型中提取出重要性排序的、可嵌套组合的低秩子模块,让同一个模型能根据不同的计算预算灵活调整大小和性能,实现‘一次训练,随处部署’,从而降低大型模型的实际部署成本。