arXiv ID:
2604.14493
arXiv 提交日期: 2026-04-16
突破设备端流式语音识别的极限:一个用于低延迟推理的紧凑、高精度英语模型 / Pushing the Limits of On-Device Streaming ASR: A Compact, High-Accuracy English Model for Low-Latency Inference
1️⃣ 一句话总结
这篇论文通过系统评估多种主流语音识别架构,并优化了量化与推理流程,成功将一个高性能的流式语音识别模型压缩了约73%,在保持准确率几乎不变的同时,实现了在CPU上比实时更快的低延迟推理,为资源受限的设备端应用设定了新的效率标杆。