arXiv ID:
2512.14202
arXiv 提交日期: 2025-12-16
理解与改进双曲深度强化学习 / Understanding and Improving Hyperbolic Deep Reinforcement Learning
1️⃣ 一句话总结
这篇论文通过分析双曲空间模型在强化学习中训练不稳定的根本原因,提出了一种名为Hyper++的新方法,通过改进价值函数、特征正则化和网络层设计,成功实现了更稳定、更高效且性能更强的双曲深度强化学习智能体。