🤖 系统
11-30 17:44
📄 论文总结
UI-Ins:通过多视角指令即推理增强图形用户界面定位能力 / UI-Ins: Enhancing GUI Grounding with Multi-Perspective Instruction-as-Reasoning
1️⃣ 一句话总结
这篇论文提出了一种将用户指令视为动态推理路径的新方法,通过多视角训练和强化学习优化路径选择,显著提升了图形界面中语言指令到可操作元素的定位准确率,并在多个基准测试中取得了领先性能。