arXiv ID:
2603.11975
HomeSafe-Bench:评估视觉语言模型在家庭场景具身智能体不安全动作检测中的表现 / HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios
1️⃣ 一句话总结
这篇论文提出了一个专门用于测试AI家庭机器人安全性的新标准(HomeSafe-Bench),并设计了一个名为HD-Guard的双层智能监控系统,它通过‘快脑’快速筛查和‘慢脑’深度分析相结合的方式,在保证实时响应的同时,更准确地识别家庭环境中的危险动作。