arXiv ID:
2602.19509
arXiv 提交日期: 2026-02-23
金字塔MoA:一种面向成本优化的任意时间推理概率框架 / Pyramid MoA: A Probabilistic Framework for Cost-Optimized Anytime Inference
1️⃣ 一句话总结
这篇论文提出了一种名为‘金字塔MoA’的智能系统架构,它通过一个轻量级调度器,仅在必要时将难题分配给更强的大模型处理,从而在保持与大模型相近的高准确率(例如在数学题上达到93%)的同时,显著降低了61%的计算成本,实现了性能与预算的高效平衡。