arXiv ID:
2604.13592
arXiv 提交日期: 2026-04-15
大语言模型战略推理的前瞻性优化 / Foresight Optimization for Strategic Reasoning in Large Language Models
1️⃣ 一句话总结
这篇论文提出了一种名为‘前瞻性策略优化’的新方法,通过让大语言模型在决策时不仅考虑自身利益,还能预测并模拟对手的潜在行动,从而显著提升了它们在多智能体合作或竞争环境中的战略决策和泛化能力。