arXiv最新AI论文速览速学

🔍

标签: #zero-shot transfer ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 60 72小时内新更新论文 72h更新 60 最新: Zero-Shot, Safe and Time-Efficient UAV Navigation via Potential-Based Reward Shaping, Control Lyapunov and Barrier Functions 05-10

arXiv ID: 2605.01787

arXiv 提交日期: 2026-05-03

reinforcement learning robotics uav navigation obstacle avoidance reward shaping safety guarantees zero-shot transfer

零样本、安全且时间高效的无人机导航：基于势能奖励塑形、控制李雅普诺夫函数与控制障碍函数 / Zero-Shot, Safe and Time-Efficient UAV Navigation via Potential-Based Reward Shaping, Control Lyapunov and Barrier Functions

1️⃣ 一句话总结

本文提出了一种结合势能奖励塑形和控制理论（李雅普诺夫与障碍函数）的强化学习方法，让无人机在无需重新训练的情况下，能在复杂环境中自动实现快速、安全的避障导航。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.20835

arXiv 提交日期: 2026-04-22

llm model training machine learning code generation reinforcement learning zero-shot transfer supervised fine-tuning programming languages

并行监督微调：提升代码强化学习的零样本跨编程语言迁移能力 / Parallel-SFT: Improving Zero-Shot Cross-Programming-Language Transfer for Code RL

1️⃣ 一句话总结

本文提出Parallel-SFT方法，通过在监督微调阶段加入多种编程语言实现相同功能的“并行程序”数据，使后续的强化学习训练能更好地将编程能力从常见语言（如Python、C++）零样本迁移到资源较少的语言（如Rust、Julia）上，实验表明该方法能让模型内部对功能相同但语言不同的代码产生更紧密的表示聚类，从而提升迁移效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.01496

arXiv 提交日期: 2026-04-02

llm agents model training software engineering agents fine-tuning code generation benchmark zero-shot transfer

从SWE-ZERO到SWE-HERO：面向软件工程智能体的从无执行到基于执行的微调方法 / From SWE-ZERO to SWE-HERO: Execution-free to Execution-based Fine-tuning for Software Engineering Agents

1️⃣ 一句话总结

这篇论文提出了一种两阶段微调方法，先让AI模型通过大量代码学习掌握语义理解，再通过实际执行反馈进行精准优化，从而打造出能高效解决真实软件工程问题的智能体，并在多个测试中取得了顶尖性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.02473

arXiv 提交日期: 2026-02-02

robotics agents model training humanoid robots imitation learning skill transfer data generation zero-shot transfer

HumanX：从人类视频中学习敏捷且可泛化的人形机器人交互技能 / HumanX: Toward Agile and Generalizable Humanoid Interaction Skills from Human Videos

1️⃣ 一句话总结

这篇论文提出了一个名为HumanX的完整框架，它能够直接从人类视频中学习人形机器人的交互技能，无需为特定任务设计复杂的奖励函数，并在多个运动与交互任务中实现了远超以往方法的泛化能力，成功将技能零样本迁移到真实机器人上。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.01634

arXiv 提交日期: 2026-02-02

natural language processing audio model training phonetic perception speech recognition acoustic-phonetics zero-shot transfer adaptive inference

HuPER：一种受人类启发的语音感知框架 / HuPER: A Human-Inspired Framework for Phonetic Perception

1️⃣ 一句话总结

这篇论文提出了一个受人类听觉系统启发的语音感知框架HuPER，它通过结合声学证据和语言知识来识别语音，仅用少量数据就在英语语音识别上取得了顶尖效果，并能直接识别95种从未训练过的语言。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.10637

arXiv 提交日期: 2025-10-12

robotics multi-modal model training sim-to-real gaussian splatting robotic manipulation mllm zero-shot transfer

基于高斯泼溅的真实世界零样本机器人操作学习高保真模拟数据生成 / High-Fidelity Simulated Data Generation for Real-World Zero-Shot Robotic Manipulation Learning with Gaussian Splatting

1️⃣ 一句话总结

这篇论文提出了一种名为RoboSimGS的新方法，通过结合3D高斯泼溅和多模态大语言模型，将真实世界图像自动转换为高保真、可物理交互的模拟环境，从而让在模拟环境中训练的机器人策略能够直接成功应用于真实世界的各种操作任务，有效解决了模拟与现实之间的性能差距问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.01787

1️⃣ 一句话总结

arXiv ID: 2604.20835

1️⃣ 一句话总结

arXiv ID: 2604.01496

1️⃣ 一句话总结

arXiv ID: 2602.02473

1️⃣ 一句话总结

arXiv ID: 2602.01634

1️⃣ 一句话总结

arXiv ID: 2510.10637

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.01787 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.20835 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.01496 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.02473 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.01634 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.10637 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.01787

arXiv ID: 2604.20835

arXiv ID: 2604.01496

arXiv ID: 2602.02473

arXiv ID: 2602.01634

arXiv ID: 2510.10637