arXiv ID:
2602.12218
arXiv 提交日期: 2026-02-12
世界模型中的观察者效应:侵入式适应会破坏潜在的物理规律 / The Observer Effect in World Models: Invasive Adaptation Corrupts Latent Physics
1️⃣ 一句话总结
这篇论文发现,在评估神经网络是否真正学会了物理规律时,传统的微调或高容量探针等‘侵入式’评估方法会破坏模型内部已学到的潜在物理结构,而他们提出的‘非侵入式’线性解码方法能更准确地揭示模型是否内化了物理世界模型。