← 返回列表

菜单

🤖 系统
📄 Abstract - MAS-Bench: A Benchmark for Evaluating GUI-Shortcut Hybrid Mobile Agents
正在获取摘要...
顶级标签: agents
详细标签: gui agents mobile automation hybrid agents benchmark evaluation rpa scripts 或 搜索:

📄 论文总结

MAS-Bench:用于评估GUI-快捷方式混合移动代理的基准测试

MAS-Bench: A Benchmark for Evaluating GUI-Shortcut Hybrid Mobile Agents


1️⃣ 一句话总结

本研究提出了MAS-Bench,首个专门用于系统评估结合图形界面操作和程序化快捷方式的混合移动代理的基准测试框架,通过139个真实场景任务和多种评估指标证明混合代理在成功率和效率上显著优于纯GUI代理。


2️⃣ 论文创新点

1. MAS-Bench基准框架

2. 自主快捷方式生成评估

3. 动态在线评估环境

4. 系统化的混合代理评估框架


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF