arXiv ID:
2603.28416
arXiv 提交日期: 2026-03-30
利用大型语言模型通过进化方法发现强化学习算法 / Evolutionary Discovery of Reinforcement Learning Algorithms via Large Language Models
1️⃣ 一句话总结
这篇论文提出了一种新方法,利用大型语言模型作为‘进化引擎’,自动生成和优化强化学习算法的核心更新规则,从而发现了性能媲美主流人工设计算法的新算法。