arXiv最新AI论文速览速学

🔍

标签: #data efficiency ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 95 72小时内新更新论文 72h更新 100 最新: Neural Scaling Laws for Boosted Jet Tagging 02-18

arXiv ID: 2602.15781

arXiv 提交日期: 2026-02-17

machine learning model training data scaling laws jet tagging high energy physics compute optimal data efficiency

用于增强喷注标记的神经缩放定律 / Neural Scaling Laws for Boosted Jet Tagging

1️⃣ 一句话总结

这篇论文研究了在高能物理的喷注分类任务中，模型性能如何随着计算资源、数据量和特征选择的增加而提升的规律，发现增加计算资源可以稳定地将性能推向一个极限，并且使用更底层、信息更丰富的特征可以提高这个性能极限。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10439

arXiv 提交日期: 2026-02-11

audio agents model training audio language models reinforcement learning tool usage data efficiency audio understanding

AudioRouter：一种基于强化学习的双推理框架，实现数据高效音频理解 / AudioRouter: Data Efficient Audio Understanding via RL based Dual Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为AudioRouter的强化学习框架，它让大型音频语言模型学会智能地决定何时以及如何使用外部音频工具来辅助推理，从而在极少训练数据下显著提升对声音细节的理解能力，避免了传统方法需要海量数据训练的弊端。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.19325

arXiv 提交日期: 2026-01-27

multi-modal llm model training multimodal llm scientific reasoning data efficiency reproducible pipeline vision-language model

创新者-VL：一个用于科学发现的多模态大语言模型 / Innovator-VL: A Multimodal Large Language Model for Scientific Discovery

1️⃣ 一句话总结

这篇论文提出了一个名为Innovator-VL的多模态大模型，它通过精心设计的训练方法和少量高质量数据，就能在科学理解和通用视觉任务上都表现出色，证明了高效、可复现的科学AI模型无需依赖海量数据。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.09088

arXiv 提交日期: 2026-01-14

llm model training model evaluation knowledge distillation reasoning sequence distillation long chain-of-thought data efficiency

面向卓越长链推理的分布对齐序列蒸馏 / Distribution-Aligned Sequence Distillation for Superior Long-CoT Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为DASD-4B-Thinking的新型轻量级开源推理模型，它通过改进传统的序列蒸馏方法，解决了教师模型输出分布与学生模型学习能力不匹配等核心问题，从而仅用少量训练数据就在数学、科学推理和代码生成等多项任务上达到了领先的开源模型性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.19402

arXiv 提交日期: 2025-12-22

robotics systems model training demonstration generation 3d editing video synthesis data efficiency manipulation tasks

Real2Edit2Real：通过3D控制界面生成机器人演示数据 / Real2Edit2Real: Generating Robotic Demonstrations via a 3D Control Interface

1️⃣ 一句话总结

这篇论文提出了一种名为Real2Edit2Real的新方法，它通过一个3D编辑界面，利用少量真实机器人演示视频，自动生成大量新的、多样化的训练数据，从而让机器人学习新技能时所需的数据量减少10到50倍，极大地提高了数据效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.16905

arXiv 提交日期: 2025-12-18

model training data aigc text-to-image data selection meta-gradient data efficiency training optimization

炼金术士：通过元梯度数据选择提升文本到图像模型训练效率 / Alchemist: Unlocking Efficiency in Text-to-Image Model Training via Meta-Gradient Data Selection

1️⃣ 一句话总结

这篇论文提出了一个名为‘炼金术士’的智能数据筛选框架，它能自动从海量图文数据中挑选出最有价值的训练样本，从而让AI绘画模型用更少的数据、更快的速度，训练出效果更好的图像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.13106

arXiv 提交日期: 2025-12-15

llm reinforcement learning model training semi-supervised learning reasoning policy optimization mathematical reasoning data efficiency

TraPO：一种用于提升大语言模型推理能力的半监督强化学习框架 / TraPO: A Semi-Supervised Reinforcement Learning Framework for Boosting LLM Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为TraPO的半监督强化学习方法，它巧妙地结合少量标注数据和大量未标注数据来训练大语言模型进行推理，在显著降低数据标注成本的同时，有效防止了模型训练崩溃，并在多个数学推理任务上取得了超越全监督方法的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.03276

arXiv 提交日期: 2025-11-05

natural language processing model training machine learning diffusion language models autoregressive models data efficiency pre-training model scaling

扩散语言模型是超级数据学习者 / Diffusion Language Models are Super Data Learners

1️⃣ 一句话总结

这项研究发现，在数据有限的情况下，扩散语言模型通过多轮训练能持续超越自回归模型，这得益于其任意顺序建模、密集计算和内置数据增强能力，即使在小规模数据上也能取得优异的下游任务表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.08565

arXiv 提交日期: 2025-10-09

multi-modal llm model training multimodal llms scaling properties end-to-end training vision-language models data efficiency

NaViL：数据约束下重新思考原生多模态大语言模型的扩展特性 / NaViL: Rethinking Scaling Properties of Native Multimodal Large Language Models under Data Constraints

1️⃣ 一句话总结

这项研究提出了一种名为NaViL的原生多模态大模型，通过端到端训练方式探索了视觉编码器与大语言模型之间的正向扩展关系，并在14个基准测试中验证了其高效且具有竞争力的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2509.20186

arXiv 提交日期: 2025-09-24

llm model training natural language processing data augmentation reasoning pre-training thinking trajectories data efficiency

思维增强预训练 / Thinking Augmented Pre-training

1️⃣ 一句话总结

这篇论文提出了一种通过自动生成思维轨迹来增强文本数据的方法，能够将大语言模型预训练的数据效率提升三倍，并在多个推理任务上显著提升模型性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.15781

1️⃣ 一句话总结

arXiv ID: 2602.10439

1️⃣ 一句话总结

arXiv ID: 2601.19325

1️⃣ 一句话总结

arXiv ID: 2601.09088

1️⃣ 一句话总结

arXiv ID: 2512.19402

1️⃣ 一句话总结

arXiv ID: 2512.16905

1️⃣ 一句话总结

arXiv ID: 2512.13106

1️⃣ 一句话总结

arXiv ID: 2511.03276

1️⃣ 一句话总结

arXiv ID: 2510.08565

1️⃣ 一句话总结

arXiv ID: 2509.20186

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.15781 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10439 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.19325 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.09088 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.19402 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.16905 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.13106 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.03276 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.08565 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2509.20186 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.15781

arXiv ID: 2602.10439

arXiv ID: 2601.19325

arXiv ID: 2601.09088

arXiv ID: 2512.19402

arXiv ID: 2512.16905

arXiv ID: 2512.13106

arXiv ID: 2511.03276

arXiv ID: 2510.08565

arXiv ID: 2509.20186