arXiv ID:
2601.19949
arXiv 提交日期: 2026-01-25
RIR-Mega-Speech:一个包含全面声学元数据且可复现评估的混响语音语料库 / RIR-Mega-Speech: A Reverberant Speech Corpus with Comprehensive Acoustic Metadata and Reproducible Evaluation
1️⃣ 一句话总结
这篇论文创建了一个名为RIR-Mega-Speech的新型混响语音数据集,它通过为每个语音文件提供精确的声学参数(如混响时间)和完整的重建脚本,解决了以往研究中数据标注不清、结果难以复现的问题,旨在为语音处理领域提供一个透明、可验证的标准评估资源。