arXiv最新AI论文速览速学

🔍

标签: #spatiotemporal reasoning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: SurgCoT: Advancing Spatiotemporal Reasoning in Surgical Videos through a Chain-of-Thought Benchmark 04-23

arXiv ID: 2604.20319

arXiv 提交日期: 2026-04-22

medical multi-modal benchmark surgical video spatiotemporal reasoning chain-of-thought evaluation multi-modal llm

SurgCoT：通过思维链基准推动手术视频中的时空推理 / SurgCoT: Advancing Spatiotemporal Reasoning in Surgical Videos through a Chain-of-Thought Benchmark

1️⃣ 一句话总结

该论文提出了SurgCoT，一个专门用于评估多模态大语言模型在手术视频中进行时空推理能力的基准数据集，通过结构化思维链框架和精细标注，揭示了当前模型在因果推理、动作对齐等关键维度上的显著不足。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20159

arXiv 提交日期: 2026-02-23

video benchmark model evaluation video reasoning scaling laws evaluation framework spatiotemporal reasoning emergent generalization

一个超大规模视频推理数据集与评测套件 / A Very Big Video Reasoning Suite

1️⃣ 一句话总结

这篇论文创建了一个前所未有的超大规模视频推理数据集和评测框架，首次系统地研究了视频模型的推理能力，并发现了模型在未见任务上出现泛化能力的早期迹象。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.10359

arXiv 提交日期: 2025-12-11

multi-modal video agents video question answering spatiotemporal reasoning tool-augmented agents large multimodal models benchmark evaluation

STAR：一种用于视频问答的时空推理框架 / Tool-Augmented Spatiotemporal Reasoning for Streamlining Video Question Answering Task

1️⃣ 一句话总结

本文提出了一种名为STAR的免训练、用户友好的智能体推理框架，通过为大型多模态模型配备一个全面的视频工具包，并采用时空工具交替调用的策略，来渐进式定位视频中的关键三维区域，从而显著提升了复杂视频问答任务的准确性和效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.00903

arXiv 提交日期: 2025-11-30

multi-modal model training robotics vision-language-action 4d understanding lightweight models spatiotemporal reasoning edge deployment

SwiftVLA：以最小开销为轻量级视觉-语言-动作模型解锁时空动态理解能力 / SwiftVLA: Unlocking Spatiotemporal Dynamics for Lightweight VLA Models at Minimal Overhead

1️⃣ 一句话总结

这篇论文提出了一种名为SwiftVLA的新型架构，它通过创新的融合令牌和掩码重建训练方法，让轻量级的视觉-语言-动作模型在保持高效率的同时，也能像大模型一样理解视频中的时空动态信息，从而在边缘设备上实现高性能、低延迟的机器人控制。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.20319

1️⃣ 一句话总结

arXiv ID: 2602.20159

1️⃣ 一句话总结

arXiv ID: 2512.10359

1️⃣ 一句话总结

arXiv ID: 2512.00903

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.20319 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20159 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.10359 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.00903 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.20319

arXiv ID: 2602.20159

arXiv ID: 2512.10359

arXiv ID: 2512.00903