arXiv ID:
2606.05889
arXiv 提交日期: 2026-06-04
GLASS:基于GRPO训练的LoRA实现零样本文本转语音中的声学风格操控 / GLASS: GRPO-Trained LoRA for Acoustic Style Steering in Zero-Shot Text-to-Speech
1️⃣ 一句话总结
本文提出了一种名为GLASS的方法,它通过为每个声学风格属性(如语速和音高)训练独立的轻量级LoRA适配器,并利用强化学习从生成结果的质量反馈中学习控制,从而在不改变原始语音样本的前提下,实现了对零样本文本转语音中不同声学风格的灵活组合与调节。