🤖 系统
11-30 17:52
📄 论文总结
Omni-AVSR:基于大语言模型的统一多模态语音识别 / Omni-AVSR: Towards Unified Multimodal Speech Recognition with Large Language Models
1️⃣ 一句话总结
这项研究提出了一个名为Omni-AVSR的统一多模态语音识别模型,它能够用一个单一模型同时处理音频、视觉及音视频结合的语音识别任务,在保持高精度的同时大幅降低了训练和部署成本,并具备适应不同效率需求的弹性推理能力。