arXiv ID:
2604.25191
arXiv 提交日期: 2026-04-28
强化学习如何实现专家级芯片布局? / How Can Reinforcement Learning Achieve Expert-level Placement?
1️⃣ 一句话总结
本文提出通过从专家设计的最终布局反向推导出每一步的放置轨迹,并用这些轨迹训练一个奖励模型,从而使强化学习在芯片布局任务中达到与人类专家相当甚至更优的效果。