arXiv ID:
2604.07035
arXiv 提交日期: 2026-04-08
Gemma 4、Phi-4与Qwen3:稠密与MoE推理语言模型在精度与效率间的权衡 / Gemma 4, Phi-4, and Qwen3: Accuracy-Efficiency Tradeoffs in Dense and MoE Reasoning Language Models
1️⃣ 一句话总结
这篇论文通过系统对比七种主流推理大模型发现,在真实资源限制下,模型的实际表现不仅取决于稀疏激活的MoE架构,更受任务类型、提示策略与架构设计的共同影响,其中Gemma-4-E4B模型在综合精度与内存效率上取得了最佳平衡。