arXiv最新AI论文速览速学

🔍

标签: #physical reasoning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Learning Physical Principles from Interaction: Self-Evolving Planning via Test-Time Memory 02-28

arXiv ID: 2602.20323

arXiv 提交日期: 2026-02-23

robotics agents model evaluation physical reasoning test-time learning memory framework vision-language models robot manipulation

通过交互学习物理原理：基于测试时记忆的自进化规划 / Learning Physical Principles from Interaction: Self-Evolving Planning via Test-Time Memory

1️⃣ 一句话总结

这篇论文提出了一个名为PhysMem的记忆框架，它能让机器人像人一样，在实际操作中通过‘动手试错’来学习具体的物理规律（比如不同球的滚动方式或石头的稳定性），并将验证过的经验转化为知识库，从而在环境变化时做出更灵活、更可靠的决策，而不是死记硬背过去的经验。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.19526

arXiv 提交日期: 2025-12-22

multi-modal model evaluation benchmark physical reasoning vision-language models quantitative evaluation kinematic estimation video understanding

QuantiPhy：评估视觉语言模型物理推理能力的定量基准 / QuantiPhy: A Quantitative Benchmark Evaluating Physical Reasoning Abilities of Vision-Language Models

1️⃣ 一句话总结

这篇论文提出了首个名为QuantiPhy的定量基准测试，用于评估视觉语言模型从视频中精确推理物体运动数值（如速度、加速度）的能力，发现当前顶尖模型更依赖预训练知识而非真实视觉输入，其数值准确性远低于表面上的合理性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.01989

arXiv 提交日期: 2025-12-01

benchmark multi-modal video physical reasoning video understanding video generation model evaluation physical dynamics

PAI-Bench：面向物理人工智能的综合基准测试 / PAI-Bench: A Comprehensive Benchmark For Physical AI

1️⃣ 一句话总结

这篇论文提出了一个名为PAI-Bench的综合基准测试，用于系统评估当前多模态大模型和视频生成模型在理解和预测真实世界物理规律方面的能力，结果发现这些模型在物理连贯性和因果推理上仍存在明显不足。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.27545

arXiv 提交日期: 2025-10-31

robotics model training agents energy-based models policy learning robust inference physical reasoning vision-language-action

EBT-策略：能量模型解锁涌现的物理推理能力 / EBT-Policy: Energy Unlocks Emergent Physical Reasoning Capabilities

1️⃣ 一句话总结

这篇论文提出了一种名为EBT-Policy的新型能量模型架构，它在机器人任务中比当前主流的扩散策略表现更好、计算效率更高，并且展现出无需额外训练就能从错误中自主恢复等智能行为。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.14980

arXiv 提交日期: 2025-10-16

llm agents model training machine design physical reasoning reinforcement learning spatial reasoning compositional assembly

组合式机器的能动设计 / Agentic Design of Compositional Machines

1️⃣ 一句话总结

这篇论文探讨了大型语言模型能否通过组合标准化零件来设计能在模拟物理环境中运行的机器，并开发了一个测试平台来评估和改进模型在空间推理、策略组装等方面的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.20323

1️⃣ 一句话总结

arXiv ID: 2512.19526

1️⃣ 一句话总结

arXiv ID: 2512.01989

1️⃣ 一句话总结

arXiv ID: 2510.27545

1️⃣ 一句话总结

arXiv ID: 2510.14980

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.20323 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.19526 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.01989 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.27545 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.14980 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.20323

arXiv ID: 2512.19526

arXiv ID: 2512.01989

arXiv ID: 2510.27545

arXiv ID: 2510.14980