arXiv ID:
2605.26399
OmniGF:一种用于统一视线追踪的双分支视觉语言框架 / OmniGF: A Dual-Branch Vision-Language Framework for Unified Gaze Following
1️⃣ 一句话总结
该论文提出了一种名为OmniGF的智能框架,通过结合视觉语言模型的双分支解码策略(一个处理语言推理、另一个处理空间定位),同时实现了高精度的视线落点预测、注视目标语义识别和多人社交场景分析,并显著提升了性能。