arXiv ID:
2605.02125
arXiv 提交日期: 2026-05-04
FedQueue:面向跨设施高性能计算训练的队列感知联邦学习 / FedQueue: Queue-Aware Federated Learning for Cross-Facility HPC Training
1️⃣ 一句话总结
本文提出了一种名为FedQueue的联邦学习协议,通过预测和利用高性能计算设施中的任务调度队列延迟,智能地调整本地训练量、控制更新延迟并聚合异构模型,从而在跨设施的分布式训练场景中显著提升训练效率和模型精度。