arXiv ID:
2512.14531
arXiv 提交日期: 2025-12-16
VersatileFFN:通过自适应宽深复用实现大语言模型的参数高效化 / VersatileFFN: Achieving Parameter Efficiency in LLMs via Adaptive Wide-and-Deep Reuse
1️⃣ 一句话总结
这篇论文提出了一种名为VersatileFFN的新型前馈网络,它通过在同一套固定参数内,自适应地复用参数来拓宽模型宽度或加深处理深度,从而在不增加内存开销的前提下,有效提升了大语言模型处理不同难度任务的能力。