arXiv最新AI论文速览速学

🔍

model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 100 最新: VideoLatent: Video-Language Learning via Latent Self-Forcing 06-23

arXiv ID: 2606.18588

arXiv 提交日期: 2026-06-17

model training computer vision systems distributed training 3d gaussian splatting scene reconstruction communication efficiency multi-gpu

Splaxel：基于像素级通信的高效分布式三维高斯泼溅训练方法用于大规模场景重建 / Splaxel: Efficient Distributed Training of 3D Gaussian Splatting for Large-scale Scene Reconstruction via Pixel-level Communication

1️⃣ 一句话总结

本文提出了一种名为Splaxel的分布式训练框架，通过让每个GPU只渲染局部场景并交换少量像素值，而不是同步全部高斯数据，从而在保持重建质量的同时，将大规模3D场景的训练速度提升至现有方法的7.6倍。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18624

arXiv 提交日期: 2026-06-17

natural language processing llm model training pragmatic reasoning counterfactual reasoning self-supervised reinforcement learning qa data generation

PragReST：面向语用语言理解的自我增强反事实推理框架 / PragReST: Self-Reinforcing Counterfactual Reasoning for Pragmatic Language Understanding

1️⃣ 一句话总结

该论文提出了一种名为PragReST的无监督训练方法，通过自动生成反事实推理数据，让大语言模型学会理解对话中的言外之意，从而在不依赖人工标注或更强模型的情况下，显著提升模型在语用推理任务上的表现，且不影响其通用知识能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19302

arXiv 提交日期: 2026-06-17

machine learning climate model training scenario design generalization emulators optimization data augmentation

面向气候模拟的最优情景设计方法 / Optimal scenario design for climate emulation

1️⃣ 一句话总结

本文提出一种通过优化训练数据（即气候变化情景）来提升AI气候模拟器泛化能力的方法，发现使用精心设计的一个优化情景训练出的模拟器，其预测效果甚至超过用六个传统标准情景训练出的模型，从而为在计算资源有限时如何高效构建高质量气候代理模型提供了新思路。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19617

arXiv 提交日期: 2026-06-17

computer vision machine learning model training image reconstruction super-resolution local spectral representation bandwidth adaptation

GB-LSR：一种基于单一全局带宽的快速局部谱图像表示，用于连续重建与超分辨率 / GB-LSR: A Fast Local Spectral Image Representation with a Single Global Bandwidth for Continuous Reconstruction and Super-Resolution

1️⃣ 一句话总结

本文提出了一种名为GB-LSR的图像表示方法，通过将图像划分为小块、每个块用傅里叶系数表示，并让所有块共享一个可学习的全局带宽，从而在任意坐标上都能快速、低成本地重建图像；相比现有方法，它在标准基准测试上提高了约3 dB的峰值信噪比，同时推理速度更快、内存消耗更低，并在超分辨率任务中同样表现出色。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19562

arXiv 提交日期: 2026-06-17

machine learning systems model training scientific machine learning fluid dynamics surrogate models physics-informed neural networks reduced-order modeling

科学机器学习在耦合流体流动与输运问题中的最新进展 / Advances in Scientific Machine Learning for Coupled Fluid Flow and Transport

1️⃣ 一句话总结

本文综述了如何利用科学机器学习方法（如基于奇异值分解的线性降阶技术和物理信息神经网络、β-变分自编码器等深度学习模型）来快速、准确地模拟复杂的耦合流体流动与传质现象，显著降低计算成本，同时通过浊流模拟和热对流案例展示了这些方法的实际效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19327

arXiv 提交日期: 2026-06-17

llm model training reasoning self-distillation rubric supervised learning reward

重新思考奖励监督：基于评分准则的自蒸馏方法 / Rethinking Reward Supervision: Rubric-Conditioned Self-Distillation

1️⃣ 一句话总结

本文提出一种新的训练推理模型的方法，通过引入详细的评分准则（rubrics）作为结构化反馈，让学生模型从自身的推理过程中学习，避免了传统蒸馏依赖昂贵且可能有错的标准答案，以及强化学习仅用单一分数指导的不足，从而在科学推理任务上取得了比现有方法更好的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18812

arXiv 提交日期: 2026-06-17

reinforcement learning machine learning model training foundation model synthetic mdp in-context learning tabular reinforcement learning attention architecture

强化学习基础模型应当已成现实 / Reinforcement Learning Foundation Models Should Already Be A Thing

1️⃣ 一句话总结

本文指出，如同表格预测领域利用合成数据成功构建基础模型一样，强化学习也能通过合成马尔可夫决策过程（MDP）来预训练一个通用的上下文学习模型，并用实验证明该模型无需微调即可高效解决在线和离线任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18864

arXiv 提交日期: 2026-06-17

machine learning systems model training automatic emergency braking semi-supervised learning pseudo-labeling autonomous driving safety

基于大规模无标注数据的可扩展学习型自动紧急制动系统 / Scaling Learning-based AEB with Massive Unlabeled Data

1️⃣ 一句话总结

本文提出了一种稳定化的半监督学习框架，通过噪声感知解耦和运动学门控伪标签技术，利用大规模未标注驾驶数据高效训练自动紧急制动系统，在百万辆级真实部署中实现了超过100:1的正误触发比和35%的无事故里程提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18765

arXiv 提交日期: 2026-06-17

machine learning computer vision model training diffusion transformers spectral correction flow-matching image generation fid improvement

SpectralDiT：面向流匹配扩散Transformer的时序条件频谱残差校正 / SpectralDiT: Timestep-Conditioned Spectral Residual Correction for Flow-Matching DiTs

1️⃣ 一句话总结

提出了一种轻量级插件SpectralDiT，通过为扩散Transformer的残差分支添加时序条件化的频谱校正模块，在仅增加极少量计算和参数的情况下，显著提升了图像生成质量，并在CIFAR-10和ImageNet-100上验证了效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18974

arXiv 提交日期: 2026-06-17

multi-modal model training model evaluation unified multimodal models self-distillation visual thoughts reasoning efficiency

视觉-操作策略自蒸馏：面向高效统一多模态推理的跨模态在线学习方法 / Visual-OPSD: Cross-Modal On-Policy Self-Distillation for Efficient Unified Multimodal Reasoning

1️⃣ 一句话总结

本文发现多模态模型中生成的“视觉思维”虽然能提升推理效果，但其代价高昂的多步扩散过程实际上并未被充分利用，因此提出了一种新的自蒸馏方法：让模型在训练过程中只依赖问题文本而不生成图像，就能从教师模型中迁移出更高效的推理能力，最终在多个基准上实现大幅加速且性能提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.18588

1️⃣ 一句话总结

arXiv ID: 2606.18624

1️⃣ 一句话总结

arXiv ID: 2606.19302

1️⃣ 一句话总结

arXiv ID: 2606.19617

1️⃣ 一句话总结

arXiv ID: 2606.19562

1️⃣ 一句话总结

arXiv ID: 2606.19327

1️⃣ 一句话总结

arXiv ID: 2606.18812

1️⃣ 一句话总结

arXiv ID: 2606.18864

1️⃣ 一句话总结

arXiv ID: 2606.18765

1️⃣ 一句话总结

arXiv ID: 2606.18974

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.18588 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18624 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19302 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19617 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19562 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19327 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18812 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18864 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18765 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18974 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.18588

arXiv ID: 2606.18624

arXiv ID: 2606.19302

arXiv ID: 2606.19617

arXiv ID: 2606.19562

arXiv ID: 2606.19327

arXiv ID: 2606.18812

arXiv ID: 2606.18864

arXiv ID: 2606.18765

arXiv ID: 2606.18974