arXiv最新AI论文速览速学

🔍

标签: #post-training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: Understanding Knowledge Distillation in Post-Training: When It Helps and When It Fails 06-23

arXiv ID: 2606.22942

arXiv 提交日期: 2026-06-22

llm model training knowledge distillation post-training instruction tuning low-data regimes student model

理解后训练阶段的知识蒸馏：何时有效与何时失效 / Understanding Knowledge Distillation in Post-Training: When It Helps and When It Fails

1️⃣ 一句话总结

本研究系统分析了在大型语言模型的后训练阶段中，知识蒸馏技术如何帮助小型学生模型提升性能，发现当训练数据较少时蒸馏效果显著优于传统微调，但在数据充足时优势减弱；不过，若使用更强的指令微调教师模型，即使在数据丰富的情况下也能带来明显提升，并针对数据稀缺场景提出了一个两阶段蒸馏策略来进一步优化模型性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.16517

arXiv 提交日期: 2026-06-15

biology llm model training post-training generalization reinforcement learning supervised fine-tuning over-specialization

后训练如何塑造生物推理模型 / How Post-Training Shapes Biological Reasoning Models

1️⃣ 一句话总结

本文通过对比实验发现，针对生物数据的推理模型在后期训练中，不同阶段（持续预训练、监督微调、强化学习）对领域内和领域外性能的影响各不相同，其中强化学习能在监督微调导致的过度专业化后部分恢复泛化能力，因此最佳策略是减少监督微调、增加强化学习投入。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.12360

arXiv 提交日期: 2026-06-10

llm model training model evaluation post-training interpretability preference data learning signal data auditing

训练后阶段的剖析：利用可解释性刻画数据并塑造学习信号 / Anatomy of Post-Training: Using Interpretability to Characterize Data and Shape the Learning Signal

1️⃣ 一句话总结

本文提出一种基于可解释性的数据驱动训练后优化方法，通过分析偏好数据中隐含的概念特征，让研究者能够明确识别并干预模型学到的行为（如过度风格化或谄媚），从而将原本黑箱式的奖励优化转变为可审计、可定制的学习信号塑造过程。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.03980

arXiv 提交日期: 2026-06-02

llm agents model evaluation reward model skill framework heterogeneous criteria evaluation orchestration post-training

技能奖励模型：通过智能体技能统一异构评价标准 / Skill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill

1️⃣ 一句话总结

本文提出Skill-RM，一种将奖励建模转化为可复用“奖励评估技能”的统一框架，通过智能体动态选择和整合多种评价证据（如规则、参考答案、检查表等），从而更灵活、透明地评估大语言模型输出，在多项测试中表现优于传统方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.01800

arXiv 提交日期: 2026-06-01

llm natural language processing multilinguality structural analysis low-resource languages representation post-training

从结构视角看大型语言模型的多语言能力 / Multilinguality of Large Language Models From a Structural Perspective

1️⃣ 一句话总结

本文通过分析大型语言模型内部的语言结构表示，发现低资源语言与英语的结构差异远大于高、中资源语言，并且针对特定语言的后训练过程会改变模型结构，但不会破坏不同语言之间的相对关系。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28814

arXiv 提交日期: 2026-05-27

llm model training evolutionary search self-improvement post-training inference

基于双向进化搜索的自我改进语言模型 / Self-Improving Language Models with Bidirectional Evolutionary Search

1️⃣ 一句话总结

本文提出了一种名为双向进化搜索（BES）的新方法，通过结合正向的候选方案进化（如重组部分解决方案）和反向的目标分解（将复杂任务拆解为可验证的子目标），解决了传统搜索方法（如最佳N采样或树搜索）在语言模型自我改进中探索范围有限和反馈稀疏的难题，显著提升了模型在训练和推理阶段的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.25459

arXiv 提交日期: 2026-05-25

llm model evaluation behavior post-training on-policy generation output distribution entropy model self-awareness recognition mechanism

从模拟到行动：后训练语言模型能够识别并回应自己的生成内容 / From Simulation to Enaction: Post-trained language models recognize and react to their own generations

1️⃣ 一句话总结

这篇论文发现，经过微调等后训练的语言模型（如对话机器人）能够从内部信号中识别出自己生成的文本，并在生成后续内容时表现得更加自信、不确定度更低，而这一能力在预训练模型中并不存在。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.20177

arXiv 提交日期: 2026-05-19

machine learning computer vision model training vision-language models perception vs reasoning post-training reinforcement learning curriculum learning

从看到思考：解耦感知与推理提升视觉语言模型的后训练效果 / From Seeing to Thinking: Decoupling Perception and Reasoning Improves Post-Training of Vision-Language Models

1️⃣ 一句话总结

这篇论文发现，当前视觉语言模型在视觉任务上的主要瓶颈在于视觉感知能力不足，而非推理能力本身，因此提出将训练过程分解为视觉感知、视觉推理和文本推理三个独立阶段，并证明这种分阶段训练方法能显著提高模型准确率、缩短推理链条，其效果优于传统混合训练和单一难度的课程学习。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26779

arXiv 提交日期: 2026-04-29

llm systems reinforcement learning rollout acceleration speculative decoding post-training throughput optimization asynchronous pipeline

通过系统集成的推测解码加速强化学习后训练中的推理生成 / Accelerating RL Post-Training Rollouts via System-Integrated Speculative Decoding

1️⃣ 一句话总结

本文提出在强化学习后训练阶段，通过集成推测解码技术（一种无损加速方法）来加速自回归推理生成，实验证明在8B参数模型下同步RL可将推理吞吐量提升1.8倍，并预测在235B规模下异步RL可带来2.5倍的端到端训练加速。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19341

arXiv 提交日期: 2026-04-21

llm machine learning systems scientific discovery evaluation-driven scaling hypothesis generation test-time scaling post-training

以评估驱动的科学发现规模化方法 / Evaluation-driven Scaling for Scientific Discovery

1️⃣ 一句话总结

本文提出了一种名为SimpleTES的通用框架，通过结合并行探索、反馈改进和局部选择，系统性地扩大评估驱动的研究循环规模，从而在多个科学领域中发现更优解决方案（如将经典LASSO算法加速两倍、减少量子电路开销24.5%等），并证明由此产生的成功轨迹还能用于训练模型，使其在解决新问题时表现更好。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.22942

1️⃣ 一句话总结

arXiv ID: 2606.16517

1️⃣ 一句话总结

arXiv ID: 2606.12360

1️⃣ 一句话总结

arXiv ID: 2606.03980

1️⃣ 一句话总结

arXiv ID: 2606.01800

1️⃣ 一句话总结

arXiv ID: 2605.28814

1️⃣ 一句话总结

arXiv ID: 2605.25459

1️⃣ 一句话总结

arXiv ID: 2605.20177

1️⃣ 一句话总结

arXiv ID: 2604.26779

1️⃣ 一句话总结

arXiv ID: 2604.19341

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.22942 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.16517 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.12360 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.03980 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.01800 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28814 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.25459 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.20177 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26779 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19341 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.22942

arXiv ID: 2606.16517

arXiv ID: 2606.12360

arXiv ID: 2606.03980

arXiv ID: 2606.01800

arXiv ID: 2605.28814

arXiv ID: 2605.25459

arXiv ID: 2605.20177

arXiv ID: 2604.26779

arXiv ID: 2604.19341