arXiv ID:
2603.17314
arXiv 提交日期: 2026-03-18
一种无候选框的查询引导网络用于基于多模态的命名实体识别与定位 / A Proposal-Free Query-Guided Network for Grounded Multimodal Named Entity Recognition
1️⃣ 一句话总结
本文提出了一种新的无候选框查询引导网络,通过文本直接引导图像区域定位,解决了传统方法因依赖通用物体检测器而难以识别特定细粒度实体的问题,从而在跨模态命名实体识别任务中实现了更精准的定位和更强的性能。