arXiv ID:
2604.25848
arXiv 提交日期: 2026-04-28
面向城市级电动网约车调度的半马尔可夫强化学习:具有可行性保证的行动策略 / Semi-Markov Reinforcement Learning for City-Scale EV Ride-Hailing with Feasibility-Guaranteed Actions
1️⃣ 一句话总结
本文提出一种结合半马尔可夫决策过程与鲁棒软演员-评论家算法(PD-RSAC)的强化学习方法,用于大规模电动网约车调度,通过混合整数线性规划保证充电、接单和重新定位动作的物理可行性,并在纽约出租车数据仿真中实现零充电桩越限和最高净收益(122万美元)。