arXiv ID:
2604.01985
arXiv 提交日期: 2026-04-02
世界行动验证器:通过前向-逆向不对称实现自我改进的世界模型 / World Action Verifier: Self-Improving World Models via Forward-Inverse Asymmetry
1️⃣ 一句话总结
这篇论文提出了一种名为‘世界行动验证器’的新方法,通过将复杂的未来状态预测任务分解为两个更简单的验证问题,并利用数据与特征维度上的不对称性,让AI世界模型能够自我检测预测错误并持续改进,从而在多种机器人任务中显著提升了学习效率和最终表现。