arXiv ID:
2602.22514
arXiv 提交日期: 2026-02-26
SignVLA:一种用于实时手语引导机器人操作的免注释词视觉-语言-动作框架 / SignVLA: A Gloss-Free Vision-Language-Action Framework for Real-Time Sign Language-Guided Robotic Manipulation
1️⃣ 一句话总结
这篇论文提出了一种名为SignVLA的新框架,它能让机器人直接看懂人的手语手势并执行相应操作,无需依赖复杂的手语注释作为中间步骤,从而实现了更自然、低成本且适合安全关键环境的实时人机交互。