arXiv ID:
2604.19151
arXiv 提交日期: 2026-04-21
印度之声:面向印度真实场景语音识别的大规模基准测试 / Voice of India: A Large-Scale Benchmark for Real-World Speech Recognition in India
1️⃣ 一句话总结
本文构建了一个包含15种印度语言、来自真实电话对话的大规模语音识别基准数据集,并揭示了现有模型在拼写变体、地区差异和音频质量等方面的性能瓶颈,为改进实际场景下的印度语音识别系统提供了关键参考。