arXiv最新AI论文速览速学

🔍

标签: #data curation ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: Ostrakon-VL: Towards Domain-Expert MLLM for Food-Service and Retail Stores 01-30

arXiv ID: 2601.21342

arXiv 提交日期: 2026-01-29

multi-modal model training benchmark multimodal llm domain-specific data curation retail evaluation benchmark

Ostrakon-VL：面向餐饮与零售商店的领域专家多模态大语言模型 / Ostrakon-VL: Towards Domain-Expert MLLM for Food-Service and Retail Stores

1️⃣ 一句话总结

这篇论文提出了一个专门为餐饮和零售商店场景设计的智能视觉语言模型Ostrakon-VL，通过创新的数据清洗方法和首个行业公开测试基准，在保持较小模型规模的同时，实现了超越更大模型的性能，能更可靠地理解和处理商店环境中的复杂视觉信息。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.17895

arXiv 提交日期: 2026-01-25

computer vision robotics systems depth completion spatial perception masked modeling rgb-d data curation

用于空间感知的掩码深度建模 / Masked Depth Modeling for Spatial Perception

1️⃣ 一句话总结

这篇论文提出了一种名为LingBot-Depth的深度补全模型，它通过将深度传感器的不准确信号视为‘掩码’，并利用视觉上下文进行修复，从而在精度和覆盖范围上超越了顶级RGB-D相机，并提供了跨RGB和深度模态的对齐表征。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.10922

arXiv 提交日期: 2026-01-16

multi-modal data model evaluation data curation vision-language reasoning dataset selection difficulty-based sampling benchmark analysis

多模态推理的数据策展中什么因素至关重要？来自DCVLR挑战的启示 / What Matters in Data Curation for Multimodal Reasoning? Insights from the DCVLR Challenge

1️⃣ 一句话总结

这项研究发现，在多模态推理任务中，从已对齐的基础数据集中精心挑选难度适中的样本，是提升模型性能的最关键因素，而单纯增加数据量或使用常见的多样性增强方法效果有限甚至有害。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.08828

arXiv 提交日期: 2026-01-13

video generation model training data motion attribution data curation gradient-based attribution temporal dynamics fine-tuning

视频生成中的运动归因 / Motion Attribution for Video Generation

1️⃣ 一句话总结

这篇论文提出了一个名为Motive的框架，它能找出训练数据中哪些视频片段对AI生成视频的‘运动效果’影响最大，并利用这些发现来优化数据选择，从而让生成的视频动作更流畅、更符合物理规律。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.02785

arXiv 提交日期: 2026-01-06

video generation aigc model training video stylization multi-modal conditioning low-rank adaptation data curation temporal consistency

DreamStyle：一种统一的视频风格化框架 / DreamStyle: A Unified Framework for Video Stylization

1️⃣ 一句话总结

这篇论文提出了一个名为DreamStyle的统一框架，它能同时支持文本、参考图片和首帧引导的视频风格化，并通过创新的数据构建和模型训练方法，有效解决了现有方法风格不一致和画面闪烁的问题，显著提升了视频质量和风格一致性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.22255

arXiv 提交日期: 2025-12-24

llm model training natural language processing chain-of-thought synthetic data reasoning distribution shift data curation

思维形态：在推理任务中，数据分布比答案正确性更重要 / Shape of Thought: When Distribution Matters More than Correctness in Reasoning Tasks

1️⃣ 一句话总结

这篇论文发现，即使使用大模型生成的、最终答案是错误的思维链数据来训练语言模型，也能提升其推理能力，因为数据分布与模型自身更匹配，且错误答案中往往包含有价值的推理步骤。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.21692

arXiv 提交日期: 2025-11-26

llm model training model evaluation generalization difficulty levels item response theory data curation evaluation

重新审视跨难度级别的泛化：这并不简单 / Revisiting Generalization Across Difficulty Levels: It's Not So Easy

1️⃣ 一句话总结

这项研究发现，大型语言模型在跨越不同难度任务时的泛化能力有限，无论是用简单还是困难的数据训练，都无法在所有难度级别上取得一致性的提升，强调了训练和评估数据中难度多样性的重要性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.20643

arXiv 提交日期: 2025-11-25

model training multi-modal data batch sampling data curation vision-language pretraining concept-aware clip

概念感知批量采样改进语言-图像预训练 / Concept-Aware Batch Sampling Improves Language-Image Pretraining

1️⃣ 一句话总结

这篇论文提出了一种名为CABS的动态批量采样方法，它能在训练过程中根据目标概念分布智能选择数据，显著提升了视觉-语言模型的性能，无需依赖预先筛选的静态数据集。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.16334

arXiv 提交日期: 2025-11-20

multi-modal model training model evaluation multimodal reasoning supervised fine-tuning reinforcement learning benchmark evaluation data curation

OpenMMReasoner：通过开放通用方法推动多模态推理前沿 / OpenMMReasoner: Pushing the Frontiers for Multimodal Reasoning with an Open and General Recipe

1️⃣ 一句话总结

这项研究提出了一个完全透明的两阶段训练方法，通过精心构建的数据集和强化学习显著提升了多模态推理能力，在多个基准测试中比现有领先模型性能提升11.6%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.06307

arXiv 提交日期: 2025-11-09

reinforcement learning natural language processing model training competitive programming code generation rlvr data curation curriculum learning

竞争性编程代码生成中基于可验证奖励的强化学习数据管理最佳实践 / DRIVE: Data Curation Best Practices for Reinforcement Learning with Verifiable Reward in Competitive Code Generation

1️⃣ 一句话总结

这篇论文提出了一套针对竞争性编程代码生成任务的数据管理和强化学习训练方法，通过两阶段强化学习和课程设计，使模型在代码竞赛中达到了与顶尖系统相当的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2601.21342

1️⃣ 一句话总结

arXiv ID: 2601.17895

1️⃣ 一句话总结

arXiv ID: 2601.10922

1️⃣ 一句话总结

arXiv ID: 2601.08828

1️⃣ 一句话总结

arXiv ID: 2601.02785

1️⃣ 一句话总结

arXiv ID: 2512.22255

1️⃣ 一句话总结

arXiv ID: 2511.21692

1️⃣ 一句话总结

arXiv ID: 2511.20643

1️⃣ 一句话总结

arXiv ID: 2511.16334

1️⃣ 一句话总结

arXiv ID: 2511.06307

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2601.21342 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.17895 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.10922 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.08828 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.02785 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.22255 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.21692 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.20643 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.16334 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.06307 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2601.21342

arXiv ID: 2601.17895

arXiv ID: 2601.10922

arXiv ID: 2601.08828

arXiv ID: 2601.02785

arXiv ID: 2512.22255

arXiv ID: 2511.21692

arXiv ID: 2511.20643

arXiv ID: 2511.16334

arXiv ID: 2511.06307