arXiv最新AI论文速览速学

🔍

标签: #pruning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 89 72小时内新更新论文 72h更新 189 最新: Prune-Quantize-Distill: An Ordered Pipeline for Efficient Neural Network Compression 04-12

arXiv ID: 2604.04988

arXiv 提交日期: 2026-04-05

model training systems machine learning neural network compression pruning quantization knowledge distillation edge deployment

剪枝-量化-蒸馏：一种面向高效神经网络压缩的有序流程 / Prune-Quantize-Distill: An Ordered Pipeline for Efficient Neural Network Compression

1️⃣ 一句话总结

这篇论文提出了一种将剪枝、量化和知识蒸馏三种技术按特定顺序组合的流程，能有效压缩神经网络模型，在保证精度的同时显著降低模型大小和实际运行时间，为在手机等边缘设备上高效部署AI模型提供了实用指南。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.27661

arXiv 提交日期: 2026-03-29

computer vision model training model evaluation edge detection transformer pruning computational efficiency vision transformer

Amped：用于边缘检测的自适应多阶段非边缘剪枝框架 / Amped: Adaptive Multi-stage Non-edge Pruning for Edge Detection

1️⃣ 一句话总结

这篇论文提出了一种名为Amped的自适应多阶段剪枝框架，它能在Transformer边缘检测器中尽早剔除高置信度的非边缘像素，从而在几乎不影响检测精度的情况下，大幅降低计算开销并提升推理速度，同时还设计了一个结构简单但性能顶尖的新型检测器SED。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.04720

arXiv 提交日期: 2026-03-05

computer vision model training machine learning neural network compression hyperspectral image classification pruning quantization knowledge distillation

高光谱图像分类中神经网络压缩方法的基准研究 / A Benchmark Study of Neural Network Compression Methods for Hyperspectral Image Classification

1️⃣ 一句话总结

这篇论文系统评估了三种主流神经网络压缩技术在高光谱图像分类任务上的效果，发现它们能在保持较高分类精度的同时，显著减小模型体积并提升计算效率，为在资源受限的遥感设备上部署深度学习模型提供了实用方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08218

arXiv 提交日期: 2026-02-09

model training llm machine learning model merging evolutionary algorithms sparsity pruning large language models

面向模型合并的稀疏感知进化框架 / Sparsity-Aware Evolution for Model Merging

1️⃣ 一句话总结

这篇论文提出了一种新的模型合并方法，它像生物进化一样，通过不断修剪和合并模型，并特别鼓励生成结构更精简（参数更少）的模型，从而在各种大型语言模型测试中更可靠地提升合并效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2509.11177

arXiv 提交日期: 2025-09-14

llm model training machine learning model compression quantization sparsity hessian optimization pruning

大语言模型联合量化与稀疏化的最优大脑修复方法 / Optimal Brain Restoration for Joint Quantization and Sparsification of LLMs

1️⃣ 一句话总结

本文提出了一种名为‘最优大脑修复’的无训练框架，通过误差补偿协同解决大语言模型量化与稀疏化之间的技术冲突，在保持模型性能的同时实现了4.72倍加速和6.4倍内存压缩。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.04988

1️⃣ 一句话总结

arXiv ID: 2603.27661

1️⃣ 一句话总结

arXiv ID: 2603.04720

1️⃣ 一句话总结

arXiv ID: 2602.08218

1️⃣ 一句话总结

arXiv ID: 2509.11177

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.04988 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.27661 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.04720 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08218 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2509.11177 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.04988

arXiv ID: 2603.27661

arXiv ID: 2603.04720

arXiv ID: 2602.08218

arXiv ID: 2509.11177