arXiv ID:
2604.24338
用强化学习完善飞机机动动作 / Perfecting Aircraft Maneuvers with Reinforcement Learning
1️⃣ 一句话总结
本研究通过训练强化学习智能体模拟多种飞行特技动作,旨在开发一套AI辅助的飞行员训练模块,帮助未来飞行员更高效地掌握特定机型的机动操作。
用强化学习完善飞机机动动作 / Perfecting Aircraft Maneuvers with Reinforcement Learning
本研究通过训练强化学习智能体模拟多种飞行特技动作,旨在开发一套AI辅助的飞行员训练模块,帮助未来飞行员更高效地掌握特定机型的机动操作。
面向仿真的可解释与可说明代理建模:关于决策可解释人工智能的现状调查与展望 / Interpretable and Explainable Surrogate Modeling for Simulations: A State-of-the-Art Survey and Perspectives on Explainable AI for Decision-Making
这篇综述论文探讨了如何将可解释人工智能(XAI)技术融入仿真代理建模流程,旨在将原本不透明的“黑箱”模型转化为易于理解的工具,从而帮助研究人员和工程师从复杂系统仿真中获取可操作的决策洞见。
基于深度强化学习的、可感知驾驶员困倦状态的自适应自主制动系统,用于提升道路安全 / Drowsiness-Aware Adaptive Autonomous Braking System based on Deep Reinforcement Learning for Enhanced Road Safety
这篇论文提出了一种能实时监测驾驶员困倦状态并据此自动调整刹车策略的智能系统,通过结合生理信号和强化学习,在模拟测试中几乎完全避免了碰撞事故。
ForestSim:用于非结构化森林环境中智能车辆感知的合成基准数据集 / ForestSim: A Synthetic Benchmark for Intelligent Vehicle Perception in Unstructured Forest Environments
这篇论文提出了一个名为ForestSim的高质量合成数据集,专门用于训练和评估智能车辆在复杂森林等非结构化越野环境中的视觉感知能力,以弥补该领域真实标注数据稀缺的不足。
评估基于强化学习的自适应交通信号控制的鲁棒性 / Evaluating the Robustness of Reinforcement Learning based Adaptive Traffic Signal Control
本研究开发并测试了一种基于强化学习的交通信号控制算法,该算法采用与真实信号控制器一致的复杂相位结构,并通过分布式训练提升效率,实验表明其在多种交通需求下能显著优于传统感应控制,但模型的鲁棒性高度依赖于训练数据的多样性。
SpaceSense-Bench:一个用于航天器感知与姿态估计的大规模多模态基准数据集 / SpaceSense-Bench: A Large-Scale Multi-Modal Benchmark for Spacecraft Perception and Pose Estimation
这篇论文提出了一个名为SpaceSense-Bench的大规模、多模态航天器感知基准数据集,它通过高保真模拟生成了包含多种传感器数据和详细标注的数据,用于评估和推动航天器视觉感知与姿态估计技术的发展,并发现当前方法在识别小部件和泛化到新航天器方面仍面临挑战。
两步智能体:决策者与人工智能决策支持交互的框架 / 2-Step Agent: A Framework for the Interaction of a Decision Maker with AI Decision Support
这篇论文提出了一个名为‘两步智能体’的计算框架,用于模拟人工智能决策支持对决策者的影响,并通过模拟发现,即使决策者只有一个错误的初始信念,使用AI支持也可能导致比不用更糟糕的决策结果,从而揭示了AI辅助决策的潜在风险。
智能环境中占用传感器布局优化 / Optimizing Occupancy Sensor Placement in Smart Environments
这篇论文提出了一种自动化的传感器布局方法,通过模拟人员轨迹和优化算法,为办公室等智能环境找到最有效的传感器安装位置,从而在不侵犯隐私的前提下,更精准地感知人员存在以实现节能。
在Veo世界模拟器中评估双子座机器人策略 / Evaluating Gemini Robotics Policies in a Veo World Simulator
这项研究开发了一个基于先进视频生成模型(Veo)的机器人策略评估系统,它能通过逼真地模拟各种真实场景变化,来全面测试机器人在常规、意外情况下的表现以及安全性,而无需进行大量实体实验。
Openpi Comet:2025 BEHAVIOR挑战赛竞赛方案 / Openpi Comet: Competition Solution For 2025 BEHAVIOR Challenge
这篇论文介绍了在2025年BEHAVIOR机器人挑战赛中获得亚军的解决方案,通过系统性地研究训练技术和数据的影响,展示了预训练和后期训练在提升机器人完成复杂家庭任务能力方面的巨大潜力,为将强大基础模型应用于现实机器人场景提供了实用建议。
请先 登录 后再提交论文