arXiv最新AI论文速览速学

🔍

标签: #data selection ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Once-For-All: A Train-Once and Select-Anytime Framework for Multimodal Instruction Tuning 05-27

arXiv ID: 2605.26761

arXiv 提交日期: 2026-05-26

machine learning multi-modal model training data selection multimodal instruction tuning vision language models transferable selector training efficiency

一次训练、随时选择：面向多模态指令微调的统一框架 / Once-For-All: A Train-Once and Select-Anytime Framework for Multimodal Instruction Tuning

1️⃣ 一句话总结

该论文提出一个名为OFA的多模态指令数据选择框架，通过仅训练一次轻量级选择器，即可无需重新计算地适用于不同数据集和不同视觉语言模型，仅用15%的数据就能达到甚至超过全量数据训练的模型性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.12303

arXiv 提交日期: 2026-04-14

machine learning model training data active learning reinforcement learning data selection batch sampling image classification

基于标记信任集引导：结合强化学习的批量主动学习 / Labeled TrustSet Guided: Batch Active Learning with Reinforcement Learning

1️⃣ 一句话总结

本文提出了一种名为BRAL-T的新框架，通过结合从已标记数据中精选的‘信任集’和强化学习策略，智能地从海量未标记数据中挑选最有价值的一批样本进行标注，从而在降低标注成本的同时，显著提升了模型在各种图像分类任务上的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.07739

arXiv 提交日期: 2026-04-09

model training data systems recommendation systems data selection continual adaptation distributional drift training efficiency

生成式推荐系统持续适应的高效数据集选择方法 / Efficient Dataset Selection for Continual Adaptation of Generative Recommenders

1️⃣ 一句话总结

这篇论文提出了一种通过智能选择少量关键数据来高效更新推荐系统的方法，使其能持续适应用户行为变化，同时避免了大规模数据重训练带来的计算负担。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.06834

arXiv 提交日期: 2026-04-08

llm model training data data selection reasoning step length confounding supervised fine-tuning log probability

论大语言模型推理数据选择中的步骤长度混淆问题 / On the Step Length Confounding in LLM Reasoning Data Selection

1️⃣ 一句话总结

这篇论文发现，在为大语言模型筛选高质量推理训练数据时，常用的基于‘自然度’的评分方法会偏向步骤更长而非质量更高的样本，并提出了两种新方法来纠正这种偏差，从而选出更优的训练数据。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.14712

arXiv 提交日期: 2026-03-16

llm model training data data-centric ai training data data preparation data selection workflow automation

迈向下一代大语言模型训练：从数据中心的视角 / Towards Next-Generation LLM Training: From the Data-Centric Perspective

1️⃣ 一句话总结

这篇论文指出当前大语言模型训练在数据准备和使用上存在效率低下、自动化不足的问题，并提出通过构建自动化的智能数据准备系统以及动态优化数据使用的训练框架，来推动下一代更高效、更智能的模型训练方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21492

arXiv 提交日期: 2026-02-25

llm reinforcement learning model training data selection policy gradient curriculum learning non-stationary optimization rlhf

GradAlign：面向大语言模型强化学习的梯度对齐数据选择方法 / GradAlign: Gradient-Aligned Data Selection for LLM Reinforcement Learning

1️⃣ 一句话总结

这篇论文提出了一种名为GradAlign的新方法，它通过选择那些能让模型训练梯度方向与一小部分可信验证集梯度方向一致的数据，来为大语言模型的强化学习自动筛选高质量训练问题，从而在各种困难数据场景下实现更稳定、更高效的模型优化。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17465

arXiv 提交日期: 2026-02-19

llm model training data data selection entropy fine-tuning uncertainty estimation computational efficiency

基于熵的语言模型数据选择方法 / Entropy-Based Data Selection for Language Models

1️⃣ 一句话总结

本文提出了一种基于熵的无监督数据选择框架，能在计算资源受限的情况下，高效筛选出高质量的训练数据，从而显著降低大语言模型微调所需的计算成本和数据量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.14249

arXiv 提交日期: 2026-01-20

llm model training model evaluation reasoning distillation chain-of-thought data selection teacher-student alignment metric

哪些推理轨迹能让学生模型更好地学习推理？一个衡量信息对齐的简单指标 / Which Reasoning Trajectories Teach Students to Reason Better? A Simple Metric of Informative Alignment

1️⃣ 一句话总结

这篇论文提出了一个名为‘排序-惊奇度比率’的简单新指标，它能有效评估用于训练学生大语言模型的推理轨迹的质量，帮助挑选出既贴合学生当前水平又富含新信息的最佳教学材料，从而显著提升模型在复杂推理任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.13697

arXiv 提交日期: 2026-01-20

llm model training data instruction tuning data selection uncertainty gradient signal-to-noise ratio efficient training

基于不确定性感知梯度信噪比的数据选择方法用于指令调优 / Uncertainty-Aware Gradient Signal-to-Noise Data Selection for Instruction Tuning

1️⃣ 一句话总结

这篇论文提出了一种名为GRADFILTERING的新方法，它通过计算数据样本的梯度信噪比来智能筛选高质量指令数据，从而在减少训练成本的同时，让大语言模型学得更快、效果更好。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.16905

arXiv 提交日期: 2025-12-18

model training data aigc text-to-image data selection meta-gradient data efficiency training optimization

炼金术士：通过元梯度数据选择提升文本到图像模型训练效率 / Alchemist: Unlocking Efficiency in Text-to-Image Model Training via Meta-Gradient Data Selection

1️⃣ 一句话总结

这篇论文提出了一个名为‘炼金术士’的智能数据筛选框架，它能自动从海量图文数据中挑选出最有价值的训练样本，从而让AI绘画模型用更少的数据、更快的速度，训练出效果更好的图像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.26761

1️⃣ 一句话总结

arXiv ID: 2604.12303

1️⃣ 一句话总结

arXiv ID: 2604.07739

1️⃣ 一句话总结

arXiv ID: 2604.06834

1️⃣ 一句话总结

arXiv ID: 2603.14712

1️⃣ 一句话总结

arXiv ID: 2602.21492

1️⃣ 一句话总结

arXiv ID: 2602.17465

1️⃣ 一句话总结

arXiv ID: 2601.14249

1️⃣ 一句话总结

arXiv ID: 2601.13697

1️⃣ 一句话总结

arXiv ID: 2512.16905

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.26761 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.12303 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.07739 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.06834 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.14712 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21492 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17465 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.14249 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.13697 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.16905 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.26761

arXiv ID: 2604.12303

arXiv ID: 2604.07739

arXiv ID: 2604.06834

arXiv ID: 2603.14712

arXiv ID: 2602.21492

arXiv ID: 2602.17465

arXiv ID: 2601.14249

arXiv ID: 2601.13697

arXiv ID: 2512.16905