arXiv最新AI论文速览速学

🔍

标签: #causal reasoning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Human Adults and LLMs as Scientists: Who Benefits from Active Exploration? 06-06

arXiv ID: 2606.06464

arXiv 提交日期: 2026-06-04

machine learning llm causal reasoning active exploration conjunctive rules disjunctive rules causal learning human-llm comparison

人类成年人与大语言模型作为科学家：主动探索谁更受益？ / Human Adults and LLMs as Scientists: Who Benefits from Active Exploration?

1️⃣ 一句话总结

本文通过一项交互式实验发现，当允许主动探索时，成年人识别复杂因果规则（如多个原因同时出现才导致结果）的能力显著提升，但这类规则仍比简单规则更难；而先进的大语言模型虽然在推断准确率上接近人类，但探索效率较低，同样存在类似的难度差距。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28779

arXiv 提交日期: 2026-05-27

multi-modal model evaluation benchmark causal reasoning vision-language models faithfulness abstraction gap diagnostic benchmark

视觉语言因果推理中的抽象鸿沟 / The Abstraction Gap in Vision-Language Causal Reasoning

1️⃣ 一句话总结

本文发现当前的视觉语言模型虽然能流利地生成因果解释，但在真正进行因果推理时表现很差，并提出了一个‘抽象鸿沟’指标来量化这种语言流畅度与因果推理能力之间的差距，实验表明多数模型存在显著鸿沟且难以通过微调弥补，但某些模型结构设计有可能缩小这一差距。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.13646

arXiv 提交日期: 2026-05-13

machine learning robotics causal reasoning autonomous driving end-to-end planning scene modeling

基于因果感知的端到端自动驾驶：通过以自我为中心的联合场景建模 / Causality-Aware End-to-End Autonomous Driving via Ego-Centric Joint Scene Modeling

1️⃣ 一句话总结

针对现有端到端自动驾驶模型忽视自车与周围车辆间因果依赖关系导致轨迹预测不一致的问题，本文提出CaAD框架，通过构建以自我为中心的联合因果建模模块和策略对齐模块，在共享场景表示中同步推理自车决策与邻近车辆行为，显著提升了复杂交互场景下的闭环驾驶性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.02454

arXiv 提交日期: 2026-05-04

software engineering causal inference causal reasoning counterfactual analysis decision making roadmap evaluation

因果软件工程：愿景与路线图 / Causal Software Engineering: A Vision and Roadmap

1️⃣ 一句话总结

本文提出用因果关系模型代替传统相关性分析，帮助软件工程师在不确定性下做出更准确决策——例如预测更改系统配置的实际影响或诊断事故的根本原因，并为此提供了从技术工具到团队落地的分阶段路线图。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24697

arXiv 提交日期: 2026-04-27

agents benchmark general causal reasoning discovery-to-application minecraft evaluation diagnostic

当前智能体能否弥合从发现到应用的鸿沟？以《我的世界》为案例的研究 / Can Current Agents Close the Discovery-to-Application Gap? A Case Study in Minecraft

1️⃣ 一句话总结

本文通过在《我的世界》游戏中设计一系列需要自主发现规律并应用来点亮指定红石灯的任务，评测了GPT-5.2等前沿AI模型，发现它们仅能达到约26%的成功率，且模型的主要瓶颈正从“如何正确解决问题”转向“如何提出正确的问题”，即识别知识缺口的能力成为新的关键挑战。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.01723

arXiv 提交日期: 2026-04-02

multi-modal agents systems autonomous driving vision-language-action causal reasoning runtime safety instruction following

面向视觉-语言-动作驾驶的因果场景叙述与运行时安全监督 / Causal Scene Narration with Runtime Safety Supervision for Vision-Language-Action Driving

1️⃣ 一句话总结

这篇论文提出了一种名为‘因果场景叙述’的新方法，通过重新组织自动驾驶模型的文本指令，使其更清晰地区分驾驶意图和环境约束，并结合运行时安全监督，显著提升了自动驾驶系统的整体性能和安全性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.23085

arXiv 提交日期: 2026-03-24

medical multi-modal model evaluation causal reasoning vision-language models medical diagnosis hallucination reduction self-reflection

MedCausalX：基于自适应的因果推理与自我反思构建可信赖的医疗视觉语言模型 / MedCausalX: Adaptive Causal Reasoning with Self-Reflection for Trustworthy Medical Vision-Language Models

1️⃣ 一句话总结

这篇论文提出了一个名为MedCausalX的新框架，它通过引入专门的因果推理链、自适应反思机制和纠错学习，让医疗AI在分析医学图像和文本时能像医生一样进行深度因果分析，从而显著减少误判和幻觉，提升诊断的可靠性和准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15237

arXiv 提交日期: 2026-03-16

multi-modal computer vision model training vision-language models anomaly detection physics-informed instruction tuning causal reasoning

用于物理基础异常检测的多轮物理信息视觉语言模型 / Multi-turn Physics-informed Vision-language Model for Physics-grounded Anomaly Detection

1️⃣ 一句话总结

这项研究通过在多轮对话中融入物体属性、运动规律等物理知识，显著提升了通用视觉语言模型在检测违反物理规律的动态异常（如不规则旋转）方面的能力，使其性能远超现有最佳方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09094

arXiv 提交日期: 2026-03-10

video generation multi-modal model training causal reasoning physics-driven generation event decomposition cross-modal prompting video diffusion models

基于事件链因果推理的物理合理视频生成 / Chain of Event-Centric Causal Thought for Physically Plausible Video Generation

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过将物理过程分解为因果关联的事件链并利用物理公式作为约束，显著提升了AI生成视频在物理规律上的合理性和连贯性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09787

arXiv 提交日期: 2026-03-10

machine learning model evaluation theory explainable ai neural networks causal reasoning feature visualization model interpretation

缺失了什么？解释由“缺席概念”激活的神经元 / What is Missing? Explaining Neurons Activated by Absent Concepts

1️⃣ 一句话总结

这篇论文发现，在深度神经网络中，某些神经元的激活不是因为输入中存在某个特征，反而是因为该特征‘缺席’了，而主流可解释AI方法难以发现这种‘缺席编码’现象，作者为此提出了两种简单的扩展方法来揭示它。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.06464

1️⃣ 一句话总结

arXiv ID: 2605.28779

1️⃣ 一句话总结

arXiv ID: 2605.13646

1️⃣ 一句话总结

arXiv ID: 2605.02454

1️⃣ 一句话总结

arXiv ID: 2604.24697

1️⃣ 一句话总结

arXiv ID: 2604.01723

1️⃣ 一句话总结

arXiv ID: 2603.23085

1️⃣ 一句话总结

arXiv ID: 2603.15237

1️⃣ 一句话总结

arXiv ID: 2603.09094

1️⃣ 一句话总结

arXiv ID: 2603.09787

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.06464 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28779 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.13646 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.02454 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24697 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.01723 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.23085 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15237 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09094 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09787 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.06464

arXiv ID: 2605.28779

arXiv ID: 2605.13646

arXiv ID: 2605.02454

arXiv ID: 2604.24697

arXiv ID: 2604.01723

arXiv ID: 2603.23085

arXiv ID: 2603.15237

arXiv ID: 2603.09094

arXiv ID: 2603.09787