arXiv ID:
2509.06477
arXiv 提交日期: 2025-09-08
MAS-Bench:一个用于评估移动GUI与快捷操作混合智能体的统一基准 / MAS-Bench: A Unified Benchmark for Shortcut-Augmented Hybrid Mobile GUI Agents
1️⃣ 一句话总结
这篇论文提出了一个名为MAS-Bench的基准测试平台,专门用于评估移动设备上结合图形界面操作和快捷方式的混合智能体,通过139个复杂任务和多种评价指标,证明了混合方法比纯图形界面操作更高效和可靠。