arXiv ID:
2604.25416
有偏的梦境:潜在空间模型中认知不确定性量化的局限性 / Biased Dreams: Limitations to Epistemic Uncertainty Quantification in Latent Space Models
1️⃣ 一句话总结
该论文揭示了一种基于潜在空间模型的强化学习算法(如Dreamer系列)在预测未来状态时,会不自觉地偏向于它已经熟悉的区域,而忽略环境中的实际变化,从而导致其对自身预测的“不确定性”判断失效,并过高估计未来可能获得的奖励。