arXiv ID:
2603.27500
arXiv 提交日期: 2026-03-29
简化的开放词汇人-物交互检测 / Streamlined Open-Vocabulary Human-Object Interaction Detection
1️⃣ 一句话总结
这篇论文提出了一个名为SL-HOI的新框架,它巧妙地利用单一视觉模型DINOv3的不同组件,无需额外融合语言模型,就能高效地检测图像中已知和未知的人与物体之间的交互动作,并在多个标准测试中取得了领先的性能。