arXiv ID:
2604.21375
arXiv 提交日期: 2026-04-23
VLAA-GUI:知道何时停止、恢复与搜索——一个模块化的GUI自动化框架 / VLAA-GUI: Knowing When to Stop, Recover, and Search, A Modular Framework for GUI Automation
1️⃣ 一句话总结
本文提出了一种模块化的图形界面自动化框架VLAA-GUI,通过三个核心组件——完整性验证器(防止过早完成任务)、循环中断器(打破重复失败)和按需搜索代理(查询未知流程)——来有效解决智能体在操作过程中容易出现的提前停止和死循环问题,并在多个基准测试中取得了超过人类水平的性能。