arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 35 72小时内新更新论文 72h更新 112 最新: DAIT: Distillation from Vision-Language Models to Lightweight Classifiers with Adaptive Intermediate Teacher Transfer 03-23

arXiv ID: 2603.03239

arXiv 提交日期: 2026-03-03

multi-modal computer vision model training earth observation latent diffusion conditional generation multimodal data stochastic modeling

COP-GEN：基于潜在扩散Transformer的哥白尼地球观测数据生成器——专为随机性设计 / COP-GEN: Latent Diffusion Transformer for Copernicus Earth Observation Data -- Generation Stochastic by Design

1️⃣ 一句话总结

这篇论文提出了一个名为COP-GEN的随机生成模型，它能够根据地球观测中的一种或多种数据（如光学图像、雷达数据），灵活、逼真地生成其他缺失或相关类型的数据，并自然地反映数据本身固有的不确定性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03278

arXiv 提交日期: 2026-03-03

robotics agents model training autonomous play trajectory warping keypoint correspondences imitation learning vision-language models

Tether：基于对应关系驱动轨迹扭曲的自主功能化交互学习 / Tether: Autonomous Functional Play with Correspondence-Driven Trajectory Warping

1️⃣ 一句话总结

这篇论文提出了一种名为Tether的新方法，它能让机器人像玩游戏一样自主探索和学习新任务：只需少量演示，机器人就能通过视觉关键点匹配来调整动作，并在现实环境中持续执行、评估和改进任务，从而自动生成大量高质量的训练数据来提升自身技能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03045

arXiv 提交日期: 2026-03-03

machine learning systems model training generative flow networks quantum compilation unitary synthesis transformers reinforcement learning

QFlowNet：基于生成流网络的快速、多样且高效的酉矩阵合成 / QFlowNet: Fast, Diverse, and Efficient Unitary Synthesis with Generative Flow Networks

1️⃣ 一句话总结

这篇论文提出了一个名为QFlowNet的新框架，它结合了生成流网络和Transformer模型，能够快速、高效地为量子计算机生成多种多样的高质量量子门电路，解决了传统强化学习方法训练慢、结果单一的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02866

arXiv 提交日期: 2026-03-03

computer vision multi-modal model training 3d reconstruction novel view synthesis gaussian splatting importance sampling sparse-view

用于稀疏视角新视图合成的分层高斯泼溅中的多模态先验引导重要性采样 / Multimodal-Prior-Guided Importance Sampling for Hierarchical Gaussian Splatting in Sparse-View Novel View Synthesis

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过融合图像颜色、语义和几何等多种信息来智能判断3D场景中哪些细节可以准确重建，从而在仅有少数几张照片的情况下，生成更清晰、更逼真的新视角图像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02548

arXiv 提交日期: 2026-03-03

computer vision systems model training 3d reconstruction semantic scene understanding novel view synthesis gaussian splatting sparse view

SemGS：基于稀疏视图的前馈式语义3D高斯泼溅用于可泛化的场景理解 / SemGS: Feed-Forward Semantic 3D Gaussian Splatting from Sparse Views for Generalizable Scene Understanding

1️⃣ 一句话总结

这项研究提出了一种名为SemGS的新方法，它能够仅用少数几张照片就快速重建出带有物体类别信息的3D场景模型，并能从任意新角度生成清晰的语义分割图，大大提升了机器人在复杂环境中理解场景的效率和实用性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02753

arXiv 提交日期: 2026-03-03

biology model training machine learning protein design bayesian optimization genetic algorithm sequence optimization peptide binder

深度学习引导的进化优化用于蛋白质设计 / Deep learning-guided evolutionary optimization for protein design

1️⃣ 一句话总结

这项研究提出了一个名为BoGA的新方法，它巧妙地将进化算法和贝叶斯优化结合起来，能更高效地在海量的蛋白质序列中搜索和设计出具有特定功能（如结合特定毒素）的新蛋白质，从而加速药物和生物技术的开发。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03180

arXiv 提交日期: 2026-03-03

llm systems model training retrieval-augmented generation industrial optimization knowledge graph code generation dependency closure

基于类型感知检索增强生成与依赖闭包的求解器可执行工业优化建模 / Type-Aware Retrieval-Augmented Generation with Dependency Closure for Solver-Executable Industrial Optimization Modeling

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过强制要求模型实体类型完整和依赖关系闭合，让大语言模型能更可靠地将自然语言需求自动转换成可直接运行的工业优化代码，解决了现有方法常因类型错误或依赖缺失导致代码无法执行的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02766

arXiv 提交日期: 2026-03-03

agents multi-agents model training automated skill discovery evolutionary algorithms agent workflows multi-agent systems failure analysis

EvoSkill：面向多智能体系统的自动化技能发现框架 / EvoSkill: Automated Skill Discovery for Multi-Agent Systems

1️⃣ 一句话总结

这篇论文提出了一个名为EvoSkill的自动化框架，它能让AI智能体像进化一样，通过分析失败案例来自主发现、优化和积累可复用的专业技能，从而显著提升其在复杂任务中的表现，并且这些技能还能直接迁移到其他任务上。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03026

arXiv 提交日期: 2026-03-03

computer vision model training multi-modal depth estimation surface normals transformer high-resolution geometry refinement

任意分辨率任意几何：从多视角到多块 / Any Resolution Any Geometry: From Multi-View To Multi-Patch

1️⃣ 一句话总结

这篇论文提出了一个名为URGT的多块Transformer模型，它通过将高分辨率图像分割成多个小块并利用跨块注意力机制进行联合处理，在单张图像上同时实现了高精度的深度和表面法线估计，显著提升了细节保持与全局一致性，并在多个指标上取得了领先的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02783

arXiv 提交日期: 2026-03-03

robotics agents model training imitation learning swarm robotics generative adversarial networks human demonstrations reinforcement learning

面向机器人集群的生成对抗模仿学习：从人类演示与训练策略中学习 / Generative adversarial imitation learning for robot swarms: Learning from human demonstrations and trained policies

1️⃣ 一句话总结

这篇论文提出了一个基于生成对抗模仿学习的框架，让机器人集群能够通过观察人类演示或已有策略的演示来学习集体行为，并在仿真和真实机器人实验中成功复现了与演示性能相当、视觉上可识别的群体行为。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.03239

1️⃣ 一句话总结

arXiv ID: 2603.03278

1️⃣ 一句话总结

arXiv ID: 2603.03045

1️⃣ 一句话总结

arXiv ID: 2603.02866

1️⃣ 一句话总结

arXiv ID: 2603.02548

1️⃣ 一句话总结

arXiv ID: 2603.02753

1️⃣ 一句话总结

arXiv ID: 2603.03180

1️⃣ 一句话总结

arXiv ID: 2603.02766

1️⃣ 一句话总结

arXiv ID: 2603.03026

1️⃣ 一句话总结

arXiv ID: 2603.02783

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.03239 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03278 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03045 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02866 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02548 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02753 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03180 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02766 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03026 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02783 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.03239

arXiv ID: 2603.03278

arXiv ID: 2603.03045

arXiv ID: 2603.02866

arXiv ID: 2603.02548

arXiv ID: 2603.02753

arXiv ID: 2603.03180

arXiv ID: 2603.02766

arXiv ID: 2603.03026

arXiv ID: 2603.02783