arXiv ID:
2606.04418
CleanCodec:通过感知引导编码实现高效且鲁棒的语音分词化 / CleanCodec: Efficient and Robust Speech Tokenization via Perceptually Guided Encoding
1️⃣ 一句话总结
本文提出了一种名为CleanCodec的新型语音编解码器,它像一个智能过滤器,只提取语音中对人耳重要的关键信息(如说话人特征和语音清晰度),同时自动忽略背景噪音等无关信息,从而在极低的数据速率下实现更高效、更准确的语音重建,并大幅提升了后续语音合成任务的运行速度。