arXiv ID:
2605.21132
arXiv 提交日期: 2026-05-20
SurgOnAir:具有层级感知能力的实时手术视频解说 / SurgOnAir: Hierarchy-Aware Real-Time Surgical Video Commentary
1️⃣ 一句话总结
该论文提出了一种名为SurgOnAir的流式视觉语言模型,它能像直播解说一样,实时逐帧分析手术视频,并同步生成从动作、步骤到阶段的多层级文字描述,从而让AI系统能即时感知并响应手术过程中的细微变化与关键转折。