arXiv最新AI论文速览速学

🔍

标签: #knowledge distillation ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: Knowledge Distillation Must Account for What It Loses 05-02

arXiv ID: 2603.15166

arXiv 提交日期: 2026-03-16

model training computer vision multi-modal knowledge distillation vision-language models fine-grained classification model compression intermediate teacher

DAIT：从视觉语言模型到轻量级分类器的自适应中间教师迁移蒸馏 / DAIT: Distillation from Vision-Language Models to Lightweight Classifiers with Adaptive Intermediate Teacher Transfer

1️⃣ 一句话总结

这篇论文提出了一种名为DAIT的新方法，通过引入一个可学习的‘中间教师’来巧妙地压缩大型视觉语言模型的知识，从而让轻量级的小模型也能高效、准确地完成细粒度图像分类任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.14898

arXiv 提交日期: 2026-03-16

machine learning model training systems knowledge distillation quantum photonics hybrid systems parameter efficiency convolutional compression

光子量子增强知识蒸馏 / Photonic Quantum-Enhanced Knowledge Distillation

1️⃣ 一句话总结

这篇论文提出了一种结合光子量子处理器和经典机器学习的新方法，利用光子硬件产生的结构化随机性来高效压缩大型神经网络模型，在保持较高准确率的同时，显著减少了学生模型的参数量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15590

arXiv 提交日期: 2026-03-16

llm model training systems knowledge distillation xlstm model compression efficient inference architecture design

向混合xLSTM架构的有效知识蒸馏 / Effective Distillation to Hybrid xLSTM Architectures

1️⃣ 一句话总结

这篇论文提出了一种新的知识蒸馏方法，成功地将计算复杂的Transformer大语言模型压缩成更高效的xLSTM架构，在多个任务上几乎无损地保留了原模型的性能，为实现更节能、低成本的语言模型提供了重要途径。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15481

arXiv 提交日期: 2026-03-16

machine learning model training data knowledge distillation tabular data feature interactions data-free learning model compression

TabKD：通过习得特征分箱的交互多样性实现表格数据知识蒸馏 / TabKD: Tabular Knowledge Distillation through Interaction Diversity of Learned Feature Bins

1️⃣ 一句话总结

本文提出了一种名为TabKD的新方法，它通过自动学习数据特征的分组并生成能广泛覆盖不同特征组合的合成数据，从而在无需原始隐私数据的情况下，有效地将大型表格预测模型的知识压缩到小型模型中。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.11342

arXiv 提交日期: 2026-03-11

natural language processing model evaluation machine learning explainable ai neural machine translation attention mechanisms knowledge distillation attribution methods

通过注意力引导的知识蒸馏评估神经机器翻译中的可解释AI归因方法 / Evaluating Explainable AI Attribution Methods in Neural Machine Translation via Attention-Guided Knowledge Distillation

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过让一个学生模型模仿老师模型的注意力模式来评估和比较不同的AI解释方法在机器翻译中的效果，发现基于注意力的解释方法最能提升翻译质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.10877

arXiv 提交日期: 2026-03-11

multi-modal model training natural language processing knowledge distillation cross-modal learning vision-language models efficient training black-box teachers

从图像到文字：面向语言模型的高效跨模态知识蒸馏（来自黑盒教师模型） / From Images to Words: Efficient Cross-Modal Knowledge Distillation to Language Models from Black-box Teachers

1️⃣ 一句话总结

这篇论文提出了一个名为ARMADA的高效跨模态知识蒸馏框架，它能够将大型视觉-语言模型（包括无法获取内部结构的黑盒模型）的知识迁移到纯语言模型中，从而显著提升语言模型在理解和生成任务上的性能，且无需对教师模型进行昂贵的多模态预训练或微调。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09385

arXiv 提交日期: 2026-03-10

computer vision multi-modal model training event cameras depth estimation knowledge distillation temporal consistency cross-modal learning

EventVGGT：探索跨模态蒸馏以实现基于事件的一致性深度估计 / EventVGGT: Exploring Cross-Modal Distillation for Consistent Event-based Depth Estimation

1️⃣ 一句话总结

本文提出了一种名为EventVGGT的新方法，通过将事件数据视为连续视频序列，并首次从视觉基础模型中提取时空和几何先验知识，有效解决了现有事件相机深度估计方法因忽略时间连续性而导致结果不一致、不准确的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09465

arXiv 提交日期: 2026-03-10

multi-modal agents model training autonomous driving vision-language-action knowledge distillation trajectory planning collaborative perception

EvoDriveVLA：通过协同感知-规划蒸馏进化的自动驾驶视觉-语言-动作模型 / EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

1️⃣ 一句话总结

这篇论文提出了一种名为EvoDriveVLA的新方法，通过结合‘自我锚定’的视觉约束和‘先知引导’的轨迹优化，协同训练自动驾驶模型，有效解决了模型在长期规划中感知能力下降和决策不稳定的问题，从而显著提升了自动驾驶系统的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05299

arXiv 提交日期: 2026-03-05

audio natural language processing model training speech language model self-supervised learning knowledge distillation autoregressive generation speech representation

WavSLM：通过WavLM蒸馏实现单流语音语言建模 / WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

1️⃣ 一句话总结

这篇论文提出了一种名为WavSLM的新型语音语言模型，它通过将自监督语音表征蒸馏并量化为单一码本，实现了无需文本监督、仅用单一数据流就能同时建模语音的语义和声学信息，从而简化了模型结构并支持流式推理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.04890

arXiv 提交日期: 2026-03-05

multi-modal federated learning model training adversarial alignment knowledge distillation heterogeneous clients privacy-preserving personalized federated learning

FedAFD：基于对抗性融合与蒸馏的多模态联邦学习 / FedAFD: Multimodal Federated Learning via Adversarial Fusion and Distillation

1️⃣ 一句话总结

这篇论文提出了一个名为FedAFD的新框架，它通过客户端上的对抗性对齐与自适应融合，以及服务器上的相似性引导蒸馏，有效解决了多模态联邦学习中因数据、任务和模型差异导致的性能瓶颈，从而在保护隐私的同时，让不同数据类型的设备能协同训练出更强大且个性化的模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.15166

1️⃣ 一句话总结

arXiv ID: 2603.14898

1️⃣ 一句话总结

arXiv ID: 2603.15590

1️⃣ 一句话总结

arXiv ID: 2603.15481

1️⃣ 一句话总结

arXiv ID: 2603.11342

1️⃣ 一句话总结

arXiv ID: 2603.10877

1️⃣ 一句话总结

arXiv ID: 2603.09385

1️⃣ 一句话总结

arXiv ID: 2603.09465

1️⃣ 一句话总结

arXiv ID: 2603.05299

1️⃣ 一句话总结

arXiv ID: 2603.04890

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.15166 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.14898 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15590 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15481 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.11342 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.10877 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09385 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09465 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05299 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.04890 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.15166

arXiv ID: 2603.14898

arXiv ID: 2603.15590

arXiv ID: 2603.15481

arXiv ID: 2603.11342

arXiv ID: 2603.10877

arXiv ID: 2603.09385

arXiv ID: 2603.09465

arXiv ID: 2603.05299

arXiv ID: 2603.04890