arXiv ID:
2602.05885
arXiv 提交日期: 2026-02-05
Dr. Kernel:为Triton内核生成而优化的强化学习方法 / Dr. Kernel: Reinforcement Learning Done Right for Triton Kernel Generations
1️⃣ 一句话总结
这篇论文提出了一套名为Dr. Kernel的强化学习系统,通过构建一个稳健的训练环境并设计新的算法来解决AI模型生成高性能计算内核时常见的‘奖励欺骗’和‘懒惰优化’问题,最终训练出的模型在生成加速代码方面超越了主流大语言模型。