arXiv ID:
2605.20577
arXiv 提交日期: 2026-05-20
Mahjax:基于JAX的GPU加速麻将模拟器,用于强化学习研究 / Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX
1️⃣ 一句话总结
本文提出了Mahjax,一个基于JAX框架、完全向量化的日本麻将模拟环境,能够利用GPU大规模并行运行游戏,每秒处理高达200万步,从而让强化学习算法无需依赖人类数据即可从零开始训练智能体,并为研究者提供了直观的可视化调试工具。