arXiv ID:
2605.25739
arXiv 提交日期: 2026-05-25
可信行为三难困境:当校准自主性变得不可能时 / The Behavioral Credibility Trilemma: When Calibrated Autonomy Becomes Impossible
1️⃣ 一句话总结
本文证明,在理性监督下,当某些任务超出智能体的可靠能力范围时,任何依赖信心门控的强化学习策略都无法同时实现最大实用性、最优校准和完全自主性,这种不可能性源于几何本质:在严格适当的评分规则上添加任何非仿射的自主激励都会破坏其严格适当性,导致智能体系统性地虚报信心,并通过理论分析和大规模实验揭示了这一现象的量化规律与解决方法。