arXiv ID:
2606.25905
arXiv 提交日期: 2026-06-24
SurgAtlas:一个包含2391小时开放手术和微创手术的大规模手术视频-语言数据集 / SurgAtlas: A Large-Scale Surgical Video-Language Dataset with 2,391 Hours of Open and Minimally Invasive Surgery
1️⃣ 一句话总结
本文推出了目前规模最大的手术视频-语言数据集SurgAtlas,包含2391小时、覆盖18个外科专业和5000多种手术类型的公开视频,首次大规模收录开放手术并建立基准,通过多层级自动标注流程提供丰富的文本描述和推理问答对,为训练全能型手术AI模型奠定了基础。