← 返回列表

菜单

🤖 系统
📄 Abstract - Explicit Spatial Guidance for GUI Grounding
正在获取摘要...
顶级标签: agents systems
详细标签: gui grounding spatial encoding position encoding cross-resolution ui automation 或 搜索:

📄 论文总结

基于显式空间引导的GUI精确定位方法

Explicit Spatial Guidance for GUI Grounding


1️⃣ 一句话总结

该论文提出了RULER tokens和I-MRoPE两项创新技术,通过显式空间引导机制解决了GUI定位任务中像素坐标映射不可靠和空间编码不平衡的问题,显著提升了跨分辨率和平台的定位精度。


2️⃣ 论文创新点

1. RULER tokens

2. Interleaved MRoPE (I-MRoPE)


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF