arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: VideoLatent: Video-Language Learning via Latent Self-Forcing 06-23

arXiv ID: 2606.19222

arXiv 提交日期: 2026-06-17

machine learning model training llm unlearning reasoning selective targeting gradient ascent model editing

机制引导的选择性遗忘：针对RLVR诱导推理行为的定向消除 / Mechanism-Guided Selective Unlearning for RLVR-Induced Reasoning

1️⃣ 一句话总结

本文提出一种名为MAST的新方法，通过分析模型内部注意力机制的变化模式，仅更新最关键的部分参数来精准消除强化学习（RLVR）训练带来的特定推理能力，同时最大程度保留模型在其他任务上的性能，相比传统全参数更新方法显著减少了副作用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.19315

arXiv 提交日期: 2026-06-17

llm machine learning model training diffusion llm formal theorem proving proof correction long-range coherence benchmark

Diffusion-Proof：超越自回归生成的正式定理证明方法 / Diffusion-Proof: Recipe for Formal Theorem Proving Beyond Auto-Regressive Generation

1️⃣ 一句话总结

本文提出了一种名为Diffusion-Proof的新型框架，首次将扩散语言模型应用于正式定理证明，通过整体证明生成和局部证明修正两种模型，显著提升了长序列推理的连贯性和准确性，在多个基准测试上超越了传统自回归模型，甚至解决了一个高级思维模型无法完成的国际数学奥林匹克问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18663

arXiv 提交日期: 2026-06-17

llm data model training data mixing pretraining dynamic scheduling proxy models

RegMix-D：通过代理训练轨迹实现动态数据混合 / RegMix-D: Dynamic Data Mixing via Proxy Training Trajectories

1️⃣ 一句话总结

本文提出了一种名为RegMix-D的动态数据混合方法，它利用小型代理模型在训练过程中的完整损失变化曲线来预测不同阶段的最优数据配比，相比传统静态混合方法（如RegMix）在更少计算资源下显著提升了大型语言模型的预训练效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18753

arXiv 提交日期: 2026-06-17

medical model training spatio-temporal atlas brain imaging alzheimer's disease disease progression neural cellular automata

SMART：一种灵活、可解释且可扩展的高分辨率成像数据时空脑图谱 / SMART: A Flexible, Interpretable, and Scalable Spatio-temporal Brain Atlas from High-Resolution Imaging Data

1️⃣ 一句话总结

本文提出了一种名为SMART的新框架，通过结合疾病进程的全局变化和患者个体的解剖特征，能够从高分辨率脑部MRI图像中构建出既直观易懂又精准预测阿尔茨海默病进展的时空脑图谱，相比现有方法在预测准确性和时间一致性上取得了更优效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18702

arXiv 提交日期: 2026-06-17

video generation model training multi-modal autoregressive diffusion bidirectional generation temporal ordering video inbetweening distillation

UniTemp：通过双向蒸馏实现任意时间顺序的视频生成 / UniTemp: Unlocking Video Generation in Any Temporal Order via Bidirectional Distillation

1️⃣ 一句话总结

这篇论文提出了一种名为UniTemp的方法，通过双向蒸馏技术训练单个模型，让视频生成不再局限于从前到后的顺序，而是可以任意向前、向后或插入式地生成，从而更灵活地满足实际视频创作需求。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.18439

arXiv 提交日期: 2026-06-16

computer vision model training systems 3d scene recovery cross-frame attention redundancy removal transformer acceleration multi-view geometry

RegimeVGGT：面向视觉几何基础变换器的逐层空间保持冗余移除 / RegimeVGGT: Layer-Wise Spatially Preserving Redundancy Removal for Visual Geometry Grounded Transformer

1️⃣ 一句话总结

该论文提出了一种无需额外训练的方法RegimeVGGT，通过分析VGGT模型中不同层的作用（浅层缺乏跨视图结构、中层负责对齐、深层对几何冗余但对位姿重要），从而针对性地对每层进行非均匀压缩，在保持重建质量的同时实现6.7倍加速。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.16281

arXiv 提交日期: 2026-06-15

llm model training model evaluation masked diffusion ensemble method decoding trajectory knowledge fusion sequence generation

现在该由谁主导解码？追踪可靠路径以实现掩码扩散语言模型的集成 / Who Should Lead Decoding Now? Tracking Reliable Trajectories for Ensembling Masked Diffusion Language Models

1️⃣ 一句话总结

本文提出了一种名为TIE的集成方法，通过动态追踪掩码扩散语言模型在解码过程中的置信度变化，选择当前最可靠的模型路径进行接力生成，从而融合多个模型的知识，显著提升复杂推理任务的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.16517

arXiv 提交日期: 2026-06-15

biology llm model training post-training generalization reinforcement learning supervised fine-tuning over-specialization

后训练如何塑造生物推理模型 / How Post-Training Shapes Biological Reasoning Models

1️⃣ 一句话总结

本文通过对比实验发现，针对生物数据的推理模型在后期训练中，不同阶段（持续预训练、监督微调、强化学习）对领域内和领域外性能的影响各不相同，其中强化学习能在监督微调导致的过度专业化后部分恢复泛化能力，因此最佳策略是减少监督微调、增加强化学习投入。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.15576

arXiv 提交日期: 2026-06-14

llm reinforcement learning model training credit assignment self-distillation reasoning chain-of-thought verifiable reward

在分叉点定位信用：基于路径条件的自蒸馏方法提升大语言模型推理能力 / Localizing Credit at the Divergence: Path-Conditioned Self-Distillation for LLM Reasoning

1️⃣ 一句话总结

本文提出了一种名为“回溯自蒸馏”的新方法，通过让模型在训练过程中参考同一批中成功的推理路径，而不是仅仅依赖最终答案，从而更精准地识别并强化推理链条中导致成功的关键决策点，显著提升了数学和代码推理任务的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.15110

arXiv 提交日期: 2026-06-13

medical machine learning model training mri reconstruction zero-shot self-supervised learning physics-driven

基于物理驱动的零样本磁共振图像重建与非局部图像先验 / Physics-Driven Zero-Shot MRI Reconstruction with Non-local Image Priors

1️⃣ 一句话总结

本文提出了一种零样本磁共振图像重建方法，通过结合物理一致性约束与图像中非局部相似性先验，在无需完整训练数据的情况下，显著提升了高加速因子下的重建质量，性能接近有监督方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.19222

1️⃣ 一句话总结

arXiv ID: 2606.19315

1️⃣ 一句话总结

arXiv ID: 2606.18663

1️⃣ 一句话总结

arXiv ID: 2606.18753

1️⃣ 一句话总结

arXiv ID: 2606.18702

1️⃣ 一句话总结

arXiv ID: 2606.18439

1️⃣ 一句话总结

arXiv ID: 2606.16281

1️⃣ 一句话总结

arXiv ID: 2606.16517

1️⃣ 一句话总结

arXiv ID: 2606.15576

1️⃣ 一句话总结

arXiv ID: 2606.15110

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.19222 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.19315 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18663 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18753 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18702 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.18439 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.16281 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.16517 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.15576 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.15110 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.19222

arXiv ID: 2606.19315

arXiv ID: 2606.18663

arXiv ID: 2606.18753

arXiv ID: 2606.18702

arXiv ID: 2606.18439

arXiv ID: 2606.16281

arXiv ID: 2606.16517

arXiv ID: 2606.15576

arXiv ID: 2606.15110