arXiv最新AI论文速览速学

🔍

标签: #knowledge distillation ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: Evaluating Explainable AI Attribution Methods in Neural Machine Translation via Attention-Guided Knowledge Distillation 03-16

arXiv ID: 2602.22495

arXiv 提交日期: 2026-02-26

llm model training reinforcement learning knowledge distillation reasoning reinforcement learning policy optimization model compression

面向大语言模型推理的强化学习感知知识蒸馏 / Reinforcement-aware Knowledge Distillation for LLM Reasoning

1️⃣ 一句话总结

本文提出了一种名为RLAD的新方法，通过在强化学习训练过程中智能地选择时机模仿更强大的教师模型，成功地将复杂大模型的推理能力高效地压缩到更小、更快的模型中，解决了传统方法中目标冲突和分布不匹配的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20574

arXiv 提交日期: 2026-02-24

llm model training natural language processing self-distillation question answering consensus gating knowledge distillation asymmetric context

GATES：基于特权上下文与共识门控的自蒸馏方法 / GATES: Self-Distillation under Privileged Context with Consensus Gating

1️⃣ 一句话总结

这篇论文提出了一种名为GATES的自蒸馏方法，它通过让模型在训练时扮演能看到参考文档的‘导师’角色，并利用多个导师答案之间的共识作为可靠的学习信号，来指导看不到文档的‘学生’模型学习完整的推理过程，从而在没有外部监督的情况下，显著提升了模型在文档缺失场景下的问答准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.12173

arXiv 提交日期: 2026-02-12

computer vision multi-modal model training vision-language segmentation model compression knowledge distillation text encoder efficient inference

SAM3-LiteText：针对高效视觉语言分割的SAM3文本编码器解剖学研究 / SAM3-LiteText: An Anatomical Study of the SAM3 Text Encoder for Efficient Vision-Language Segmentation

1️⃣ 一句话总结

这篇论文通过分析大量真实分割提示，发现现有视觉语言分割模型中的文本编码器存在严重冗余，并据此设计了一个轻量化的文本编码框架，在保持分割性能的同时，将模型参数减少了高达88%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11550

arXiv 提交日期: 2026-02-12

model training model evaluation machine learning time series forecasting foundation models parametric adaptation knowledge distillation distribution shift

TS-Memory：用于时间序列基础模型的即插即用记忆模块 / TS-Memory: Plug-and-Play Memory for Time Series Foundation Models

1️⃣ 一句话总结

这篇论文提出了一种名为TS-Memory的轻量级记忆适配器，它通过一种两阶段的训练方法，将检索式方法的预测优势‘蒸馏’到一个参数化模块中，从而让时间序列基础模型在无需额外检索开销的情况下，就能更好地适应新领域的数据分布，同时保持高效推理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.12125

arXiv 提交日期: 2026-02-12

model training reinforcement learning llm knowledge distillation on-policy learning reward shaping teacher-student kl regularization

超越教师的学习：基于奖励外推的广义策略蒸馏 / Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

1️⃣ 一句话总结

本文提出了一种改进的“策略蒸馏”方法，通过调整奖励权重和选择更合适的参考模型，使得学生模型不仅能有效学习教师模型的知识，甚至在特定情况下能超越教师的性能边界。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11858

arXiv 提交日期: 2026-02-12

multi-modal model training model evaluation multimodal llms fine-grained perception knowledge distillation visual question answering benchmark

无需放大：面向细粒度多模态感知的区域到图像蒸馏 / Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

1️⃣ 一句话总结

这篇论文提出了一种名为‘区域到图像蒸馏’的新训练方法，它能让多模态大语言模型在单次前向推理中就具备强大的细粒度视觉识别能力，从而避免了传统方法需要反复放大图像区域所带来的高延迟问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10458

arXiv 提交日期: 2026-02-11

reinforcement learning agents multi-modal autonomous driving vision-language models knowledge distillation reward shaping asynchronous inference

Found-RL：基于基础模型增强的强化学习用于自动驾驶 / Found-RL: foundation model-enhanced reinforcement learning for autonomous driving

1️⃣ 一句话总结

这篇论文提出了一个名为Found-RL的平台，它通过异步批量推理框架和多种监督机制，将大型视觉语言模型的知识高效地融入强化学习，从而在保持实时推理速度的同时，显著提升了自动驾驶策略的样本效率和语义理解能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.09509

arXiv 提交日期: 2026-02-10

model training machine learning theory knowledge distillation model compression neural network inheritance low-rank decomposition singular value decomposition

超越学生：一种用于神经网络继承的非对称网络 / Beyond Student: An Asymmetric Network for Neural Network Inheritance

1️⃣ 一句话总结

这篇论文提出了一种名为InherNet的新方法，它通过非对称低秩分解直接继承大型教师网络的结构和核心知识，从而构建出比传统知识蒸馏方法性能更强、参数更少的轻量级网络。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08395

arXiv 提交日期: 2026-02-09

video model training computer vision video restoration diffusion models temporal alignment knowledge distillation adversarial training

D^2-VR：基于协同优化策略的、抗退化且经过蒸馏的视频修复方法 / D$^2$-VR: Degradation-Robust and Distilled Video Restoration with Synergistic Optimization Strategy

1️⃣ 一句话总结

这篇论文提出了一种名为D^2-VR的新方法，它通过设计抗退化的运动对齐模块和采用对抗性蒸馏技术，在保证视频修复高质量的同时，将处理速度大幅提升了12倍，有效解决了现有方法速度慢且面对复杂画面退化时效果不稳定的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04577

arXiv 提交日期: 2026-02-04

llm model evaluation natural language processing uncertainty quantification semantic distillation hallucination detection model calibration knowledge distillation

用于语言模型不确定性量化的语义自蒸馏 / Semantic Self-Distillation for Language Model Uncertainty

1️⃣ 一句话总结

这篇论文提出了一种名为‘语义自蒸馏’的方法，通过训练一个轻量级的学生模型来快速预测大语言模型输出答案的语义分布，从而高效地估计模型的不确定性，用于检测模型可能产生的幻觉或不可靠回答。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.22495

1️⃣ 一句话总结

arXiv ID: 2602.20574

1️⃣ 一句话总结

arXiv ID: 2602.12173

1️⃣ 一句话总结

arXiv ID: 2602.11550

1️⃣ 一句话总结

arXiv ID: 2602.12125

1️⃣ 一句话总结

arXiv ID: 2602.11858

1️⃣ 一句话总结

arXiv ID: 2602.10458

1️⃣ 一句话总结

arXiv ID: 2602.09509

1️⃣ 一句话总结

arXiv ID: 2602.08395

1️⃣ 一句话总结

arXiv ID: 2602.04577

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.22495 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20574 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.12173 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11550 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.12125 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11858 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10458 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.09509 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08395 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04577 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.22495

arXiv ID: 2602.20574

arXiv ID: 2602.12173

arXiv ID: 2602.11550

arXiv ID: 2602.12125

arXiv ID: 2602.11858

arXiv ID: 2602.10458

arXiv ID: 2602.09509

arXiv ID: 2602.08395

arXiv ID: 2602.04577