← 返回列表

菜单

🤖 系统
📄 Abstract - Variance-Aware Sampling for Multimodal Reasoning Model Training
正在获取摘要...
顶级标签: agents
详细标签: variance-aware sampling multimodal reasoning reinforcement learning training stability data selection 或 搜索:

📄 论文总结

基于方差感知采样的多模态推理模型训练优化

Variance-Aware Sampling for Multimodal Reasoning Model Training


1️⃣ 一句话总结

本文提出了一种方差感知采样方法来解决多模态推理模型训练中的稳定性问题,并发布了大规模高质量训练资源。


2️⃣ 论文创新点

1. 方差感知采样(VAS)

2. 方差促进分数(VPS)

3. 大规模开放资源发布


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF