arXiv ID:
2605.14249
arXiv 提交日期: 2026-05-14
EnergyLens:面向多GPU大语言模型推理优化的预测性节能探索 / EnergyLens: Predictive Energy-Aware Exploration for Multi-GPU LLM Inference Optimization
1️⃣ 一句话总结
本文提出了一种名为EnergyLens的框架,能够在不进行昂贵实际测试的情况下,准确预测多GPU环境下大语言模型推理的能耗,帮助开发者快速选择最优的部署配置和优化策略,从而实现节能目标。