arXiv最新AI论文速览速学

🔍

标签: #dataset curation ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: PrefSQA: Pairwise Preference Prediction for Speech Quality Assessment and the Critical Role of High Quality Datasets 06-22

arXiv ID: 2606.19597

arXiv 提交日期: 2026-06-17

audio machine learning model evaluation speech quality assessment preference prediction mean opinion scores uncertainty-aware logits dataset curation

PrefSQA：用于语音质量评估的成对偏好预测及高质量数据集的关键作用 / PrefSQA: Pairwise Preference Prediction for Speech Quality Assessment and the Critical Role of High Quality Datasets

1️⃣ 一句话总结

该论文提出了一种名为PrefSQA的语音质量评估方法，通过让听者直接比较两段语音的好坏生成更可靠的偏好标签，并设计了结合不确定性感知和注意力机制的模型，实验表明在高质量偏好数据上相比传统评分方法有显著提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.02379

arXiv 提交日期: 2026-06-01

computer vision data model training metric depth estimation scale-collapse monocular geometry dataset curation poisson completion

哎呀，我把凯旋门变小了！——用新数据集破解单目深度估计的“尺度崩塌”难题 / Honey, I Shrunk the Arc de Triomphe!

1️⃣ 一句话总结

本文发现当前AI模型在测量远方物体大小时会出现“尺度崩塌”（比如把远处的凯旋门估测得矮小），原因主要是训练数据不够真实多样，于是研究者从网络照片和立体影像中收集真实数据，创建了MetricScenes数据集，并用新算法修复深度图，成功提升了模型在真实开放场景下对距离和尺寸的测量精度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.26971

arXiv 提交日期: 2026-05-26

llm data rlvr data lineage data contamination benchmark dataset curation

寻找RLVR数据集的源头：追溯数据血缘以构建更优的训练数据 / RLVR Datasets and Where to Find Them: Tracing Data Lineage for Better Training Data

1️⃣ 一句话总结

这篇论文发现当前众多用于强化学习（基于可验证奖励）的数据集大多来源于少数几个共享的原始数据源，并存在数据污染问题，因此提出了一套名为ATLAS的血缘追踪框架和一个新的高质量数据集DAPO++，通过追溯每个样本的原始来源来评估其价值，从而筛选出更干净、更有效的训练数据。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15253

arXiv 提交日期: 2026-03-16

model evaluation benchmark multi-modal hallucination detection vision-language models image captioning dataset curation evaluation benchmark

HalDec-Bench：图像描述任务中幻觉检测器的基准测试 / HalDec-Bench: Benchmarking Hallucination Detector in Image Captioning

1️⃣ 一句话总结

这篇论文提出了一个名为HalDec-Bench的新基准测试，用于系统评估视觉语言模型在检测图像描述中‘幻觉’（即描述与图像内容不符的错误）的能力，并发现现有检测器倾向于盲目相信描述开头的句子，同时指出可以利用强大的视觉语言模型作为过滤器来有效提升训练数据的质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.10716

arXiv 提交日期: 2026-01-15

computer vision multi-modal model training novel view synthesis dynamic scenes self-supervised learning transient removal dataset curation

WildRayZer：动态环境中自监督的大视角合成 / WildRayZer: Self-supervised Large View Synthesis in Dynamic Environments

1️⃣ 一句话总结

这篇论文提出了一个名为WildRayZer的自监督框架，它能够从动态视频中学习，有效区分并重建场景中静止的背景和移动的物体，从而在相机和物体都在运动的情况下，仅通过一次前向计算就能生成高质量、无“鬼影”的新视角图像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.04151

arXiv 提交日期: 2026-01-07

multi-modal aigc model training audio-video generation diffusion transformers multitask learning dataset curation attention mechanisms

Klear：统一的多任务音视频联合生成 / Klear: Unified Multi-Task Audio-Video Joint Generation

1️⃣ 一句话总结

这篇论文提出了一个名为Klear的统一模型，通过创新的架构设计、训练策略和高质量数据集构建，解决了音视频生成中常见的不同步、口型不匹配等问题，能够高质量地生成同步且符合指令的音视频内容。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.21472

arXiv 提交日期: 2025-12-25

medical data computer vision medical image segmentation multi-annotator dataset skin lesion dermoscopic imaging dataset curation

IMA++：ISIC档案多标注者皮肤镜病灶分割数据集 / IMA++: ISIC Archive Multi-Annotator Dermoscopic Skin Lesion Segmentation Dataset

1️⃣ 一句话总结

这篇论文发布了一个目前最大的公开多标注者皮肤镜图像病灶分割数据集，包含近1.5万张图像和1.7万个分割标注，并提供了标注者技能等元数据，以支持医学图像分割中标注者差异和偏好建模等研究。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.05076

arXiv 提交日期: 2025-12-04

video generation aigc model training 4d control camera pose decoupling video diffusion temporal control dataset curation

子弹时间：用于视频生成的时空解耦控制框架 / BulletTime: Decoupled Control of Time and Camera Pose for Video Generation

1️⃣ 一句话总结

这篇论文提出了一个名为‘子弹时间’的新框架，它能够像独立调节时间和摄像机视角一样，分别精确控制生成视频中场景的动态变化和拍摄角度，从而解决了现有视频生成模型难以实现精细时空控制的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.19597

1️⃣ 一句话总结

arXiv ID: 2606.02379

1️⃣ 一句话总结

arXiv ID: 2605.26971

1️⃣ 一句话总结

arXiv ID: 2603.15253

1️⃣ 一句话总结

arXiv ID: 2601.10716

1️⃣ 一句话总结

arXiv ID: 2601.04151

1️⃣ 一句话总结

arXiv ID: 2512.21472

1️⃣ 一句话总结

arXiv ID: 2512.05076

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.19597 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.02379 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.26971 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15253 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.10716 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.04151 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.21472 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.05076 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.19597

arXiv ID: 2606.02379

arXiv ID: 2605.26971

arXiv ID: 2603.15253

arXiv ID: 2601.10716

arXiv ID: 2601.04151

arXiv ID: 2512.21472

arXiv ID: 2512.05076