arXiv ID:
2603.10395
arXiv 提交日期: 2026-03-11
Graph-GRPO:使用强化学习训练图流模型 / Graph-GRPO: Training Graph Flow Models with Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一种名为Graph-GRPO的新方法,它通过强化学习来训练图生成模型,使其能更好地满足复杂的人工偏好或特定任务目标,从而在药物发现等领域的分子优化任务上取得了领先的性能。