arXiv ID:
2603.25241
arXiv 提交日期: 2026-03-26
用于神经组合优化的离线决策变换器:在旅行商问题上超越启发式算法 / Offline Decision Transformers for Neural Combinatorial Optimization: Surpassing Heuristics on the Traveling Salesman Problem
1️⃣ 一句话总结
这篇论文提出了一种基于离线强化学习的新方法,通过直接学习已有启发式算法的解决方案数据集,不仅模仿而且综合优化,最终在旅行商问题上生成了比训练数据中使用的四种经典启发式算法质量更高的路径方案。