arXiv ID:
2604.13715
arXiv 提交日期: 2026-04-15
迈向细粒度时间感知:利用音频侧时间提示对大音频-语言模型进行后训练 / Towards Fine-grained Temporal Perception: Post-Training Large Audio-Language Models with Audio-Side Time Prompt
1️⃣ 一句话总结
这项研究提出了一种名为TimePro-RL的新方法,通过向音频数据中嵌入时间戳提示并结合强化学习,有效提升了大型音频-语言模型在识别声音事件起止时间等精细时间任务上的能力。