← 返回列表

菜单

🤖 系统
📄 Abstract - UI-Ins: Enhancing GUI Grounding through Instruction-as-Reasoning
正在获取摘要...
顶级标签: agents
详细标签: gui grounding instruction reasoning ui interaction reinforcement learning visual localization 或 搜索:

📄 论文总结

UI-Ins:基于指令推理的图形用户界面定位增强方法 / UI-Ins: Enhancing GUI Grounding through Instruction-as-Reasoning


1️⃣ 一句话总结

本文提出了UI-Ins模型,通过创新的Instruction-as-Reasoning范式和两阶段训练框架,显著提升了图形用户界面定位任务的性能,在多个基准测试中创造了新的SOTA结果。


2️⃣ 论文创新点

1. Instruction-as-Reasoning范式

2. 两阶段训练框架

3. 数据质量改进与多视角指令增强


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF