arXiv最新AI论文速览速学

🔍

robotics ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: Thermal Image Refinement with Depth Estimation using Recurrent Networks for Monocular ORB-SLAM3 03-17

arXiv ID: 2602.22056

arXiv 提交日期: 2026-02-25

robotics agents model training human-in-the-loop policy correction visuomotor policies robotic manipulation interactive learning

FlowCorrect：机器人操作中生成流策略的高效交互式修正 / FlowCorrect: Efficient Interactive Correction of Generative Flow Policies for Robotic Manipulation

1️⃣ 一句话总结

这篇论文提出了一个名为FlowCorrect的框架，它允许人类在机器人执行任务时，通过少量简单的姿势修正来即时调整其行为策略，从而显著提升机器人在复杂场景下的成功率，而无需重新训练整个模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20517

arXiv 提交日期: 2026-02-24

agents robotics natural language processing imitation learning human-ai coordination inner speech vision-language models behavioral steering

内心言语作为行为引导：用于人机协调的多样化行为的可操控模仿 / Inner Speech as Behavior Guides: Steerable Imitation of Diverse Behaviors for Human-AI coordination

1️⃣ 一句话总结

这篇论文提出了一种名为MIMIC的新方法，它模仿人类‘内心独白’指导行动的方式，让AI不仅能更逼真地模仿人类多样化的行为，还能在执行任务时通过语言指令进行精细的行为操控，从而更好地与人协作。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21203

arXiv 提交日期: 2026-02-24

robotics reinforcement learning computer vision sim-to-real visual rl soft actor critic manipulation domain randomization

Squint：用于仿真到现实机器人的快速视觉强化学习 / Squint: Fast Visual Reinforcement Learning for Sim-to-Real Robotics

1️⃣ 一句话总结

这篇论文提出了一种名为Squint的新型视觉强化学习方法，它通过结合并行仿真、分布化评估器等多种优化技术，能在单张GPU上仅用数分钟快速训练出机器人视觉操控策略，并成功从仿真环境迁移到真实机器人上。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21101

arXiv 提交日期: 2026-02-24

computer vision robotics systems neural radiance fields event cameras visual-inertial odometry 3d reconstruction motion blur

面向快速飞行无人机的、基于事件辅助的清晰辐射场重建 / Event-Aided Sharp Radiance Field Reconstruction for Fast-Flying Drones

1️⃣ 一句话总结

这项研究提出了一种新方法，通过融合高速飞行无人机拍摄的模糊图像和异步事件流数据，成功重建出清晰、高保真的三维场景模型，解决了快速运动导致图像模糊和定位不准的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20659

arXiv 提交日期: 2026-02-24

robotics multi-modal agents vision-language-action long-horizon manipulation belief state partial observability diffusion policy

递归信念视觉语言模型 / Recursive Belief Vision Language Model

1️⃣ 一句话总结

这篇论文提出了一个名为RB-VLA的新模型，它通过引入一个持续更新的内部‘信念’状态来记住任务历史和物体交互，从而显著提升了机器人在部分可观测环境下执行多步骤操作任务的成功率和效率，并大幅降低了计算延迟。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20925

arXiv 提交日期: 2026-02-24

robotics computer vision systems thermal slam visual odometry dynamic environments stereo vision loop closure

LST-SLAM：一种用于公里级动态环境的立体热成像SLAM系统 / LST-SLAM: A Stereo Thermal SLAM System for Kilometer-Scale Dynamic Environments

1️⃣ 一句话总结

这篇论文提出了一种名为LST-SLAM的新型立体热成像SLAM系统，它通过结合自监督特征学习、多级运动跟踪和语义-几何混合约束等方法，有效解决了在光照恶劣、天气复杂的大规模动态户外环境中，机器人定位与建图不稳定的难题，并在公里级数据集上展现出超越现有方法的鲁棒性和精度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20632

arXiv 提交日期: 2026-02-24

computer vision robotics systems 3d object detection sensor fusion autonomous driving 4d radar transformer

通过4D雷达与相机跨视图关联提升实例感知能力，用于3D目标检测 / Boosting Instance Awareness via Cross-View Correlation with 4D Radar and Camera for 3D Object Detection

1️⃣ 一句话总结

这篇论文提出了一种名为SIFormer的新方法，它通过巧妙结合4D雷达和相机数据，并利用跨视图激活机制，有效解决了雷达数据稀疏导致的实例感知难题，从而在自动驾驶的3D目标检测任务中取得了领先的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20566

arXiv 提交日期: 2026-02-24

robotics multi-modal model training token pruning vision-language-action robotic manipulation efficiency multi-view

BFA++：面向多视角视觉语言动作模型的分层最佳特征感知令牌剪枝 / BFA++: Hierarchical Best-Feature-Aware Token Prune for Multi-View Vision Language Action Model

1️⃣ 一句话总结

本文提出了一种名为BFA++的动态令牌剪枝框架，它通过分层策略智能筛选多视角图像中的关键视觉信息，从而在显著提升机器人操作模型计算速度的同时，保持甚至提高了任务执行的成功率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21141

arXiv 提交日期: 2026-02-24

computer vision robotics systems synthetic data generation domain randomization sim-to-real transfer object perception industrial vision

SynthRender与IRIS：用于工业物体感知双向虚实迁移的开源框架与数据集 / SynthRender and IRIS: Open-Source Framework and Dataset for Bidirectional Sim-Real Transfer in Industrial Object Perception

1️⃣ 一句话总结

这篇论文提出了一个名为SynthRender的开源框架和一个名为IRIS的工业图像数据集，旨在通过合成图像生成和现实到仿真的双向技术，低成本、高效地解决工业物体识别中真实数据获取困难的问题，并在多个测试中取得了优异的识别准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20060

arXiv 提交日期: 2026-02-23

robotics multi-modal model training autonomous driving trajectory generation generative models flow matching end-to-end planning

MeanFuser：基于MeanFlow的快速一步多模态轨迹生成与自适应重建用于端到端自动驾驶 / MeanFuser: Fast One-Step Multi-Modal Trajectory Generation and Adaptive Reconstruction via MeanFlow for End-to-End Autonomous Driving

1️⃣ 一句话总结

这篇论文提出了一个名为MeanFuser的端到端自动驾驶新方法，它通过使用连续的高斯混合噪声替代离散的轨迹锚点、引入平均流模型加速推理，并配备一个自适应重建模块，从而在保证高性能的同时，大幅提升了轨迹规划的鲁棒性和运行效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.22056

1️⃣ 一句话总结

arXiv ID: 2602.20517

1️⃣ 一句话总结

arXiv ID: 2602.21203

1️⃣ 一句话总结

arXiv ID: 2602.21101

1️⃣ 一句话总结

arXiv ID: 2602.20659

1️⃣ 一句话总结

arXiv ID: 2602.20925

1️⃣ 一句话总结

arXiv ID: 2602.20632

1️⃣ 一句话总结

arXiv ID: 2602.20566

1️⃣ 一句话总结

arXiv ID: 2602.21141

1️⃣ 一句话总结

arXiv ID: 2602.20060

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.22056 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20517 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21203 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21101 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20659 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20925 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20632 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20566 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21141 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20060 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.22056

arXiv ID: 2602.20517

arXiv ID: 2602.21203

arXiv ID: 2602.21101

arXiv ID: 2602.20659

arXiv ID: 2602.20925

arXiv ID: 2602.20632

arXiv ID: 2602.20566

arXiv ID: 2602.21141

arXiv ID: 2602.20060