arXiv ID:
2510.17234
arXiv 提交日期: 2025-10-20
持续音视频分割中的模态纠缠驯服 / Taming Modality Entanglement in Continual Audio-Visual Segmentation
1️⃣ 一句话总结
本文提出了一种新的持续音视频分割任务,通过设计碰撞式多模态复习框架,解决了多模态语义漂移和共现混淆问题,显著提升了模型在连续学习新类别时的性能。