arXiv ID:
2512.14080
arXiv 提交日期: 2025-12-16
SonicMoE:通过IO和Tile感知优化加速混合专家模型 / SonicMoE: Accelerating MoE with IO and Tile-aware Optimizations
1️⃣ 一句话总结
这篇论文提出了一种名为SonicMoE的新方法,通过减少内存占用、优化计算流程并引入智能的令牌分配策略,显著提升了混合专家模型的训练速度和硬件效率。