🤖 系统
11-30 17:27
📄 论文总结
Morae:主动暂停UI代理以支持用户选择 / Morae: Proactively Pausing UI Agents for User Choices
1️⃣ 一句话总结
这篇论文提出了一种名为Morae的UI代理,它能在执行任务时自动识别关键决策点并暂停,让用户参与选择,从而在提升自动化效率的同时保障用户自主权,尤其改善了视障用户的使用体验。
请先 登录 后再提交论文
Morae:主动暂停UI代理以支持用户选择 / Morae: Proactively Pausing UI Agents for User Choices
这篇论文提出了一种名为Morae的UI代理,它能在执行任务时自动识别关键决策点并暂停,让用户参与选择,从而在提升自动化效率的同时保障用户自主权,尤其改善了视障用户的使用体验。
EO-1:用于通用机器人控制的交错式视觉-文本-动作预训练 / EO-1: Interleaved Vision-Text-Action Pretraining for General Robot Control
这篇论文提出了一个名为EO-1的通用机器人基础模型,它通过交错学习视觉、文本和动作数据,显著提升了机器人在复杂任务中的多模态推理和动作执行能力。
InternVL3.5:在通用性、推理能力和效率上推进开源多模态模型 / InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency
这篇论文提出了InternVL 3.5开源多模态模型,通过创新的两阶段强化学习框架和动态视觉分辨率调节技术,显著提升了模型的推理能力、运行效率及通用性,并在多项任务中接近顶尖商业模型的性能。