arXiv ID:
2603.02348
arXiv 提交日期: 2026-03-02
离散领域中的扩散模型预测控制:可行性约束、规划视野效应与价值函数对齐——以俄罗斯方块为例研究 / Diffusion-MPC in Discrete Domains: Feasibility Constraints, Horizon Effects, and Critic Alignment: Case study with Tetris
1️⃣ 一句话总结
这项研究以俄罗斯方块为例,揭示了在离散组合决策问题中使用扩散模型进行规划时,必须通过可行性约束过滤无效动作、谨慎选择规划视野长度,并注意预训练价值评估模型可能存在的偏差,否则会导致规划性能下降。