arXiv ID:
2605.19484
CutVerse:面向媒体后期剪辑的模块化GUI智能体基准测试 / CutVerse: A Compositional GUI Agents Benchmark for Media Post-Production Editing
1️⃣ 一句话总结
本文提出了CutVerse基准测试,专门用于评估AI智能体在专业媒体后期制作(如视频剪辑、图像编辑)中的操作能力,并揭示了现有智能体在复杂、长任务流程中成功率仅36%的显著局限。