📄 论文总结
通过多粒度语言学习提升医学视觉理解 / Boosting Medical Visual Understanding From Multi-Granular Language Learning
1️⃣ 一句话总结
这项研究提出了一种名为MGLL的多粒度语言学习框架,通过整合不同粒度的文本描述和软标签监督,有效提升了医学影像中多标签和跨粒度对齐的准确性,在多个下游任务中表现优于现有先进方法。
请先 登录 后再提交论文
通过多粒度语言学习提升医学视觉理解 / Boosting Medical Visual Understanding From Multi-Granular Language Learning
这项研究提出了一种名为MGLL的多粒度语言学习框架,通过整合不同粒度的文本描述和软标签监督,有效提升了医学影像中多标签和跨粒度对齐的准确性,在多个下游任务中表现优于现有先进方法。
Llama-Embed-Nemotron-8B:面向多语言与跨语言任务的通用文本嵌入模型 / Llama-Embed-Nemotron-8B: A Universal Text Embedding Model for Multilingual and Cross-Lingual Tasks
这篇论文提出了一个开源的通用文本嵌入模型,通过在多语言任务中实现顶尖性能并公开模型权重与训练细节,为检索、分类等任务提供了灵活高效的解决方案。
基于梯度注意力引导的双掩码协同框架实现鲁棒的文本行人检索 / Gradient-Attention Guided Dual-Masking Synergetic Framework for Robust Text-based Person Retrieval
本研究通过构建大规模高质量行人图像文本数据集WebPerson,并提出一种自适应掩码噪声文本并增强细粒度语义学习的协同框架,显著提升了基于文本的行人检索性能。
NER检索器:基于类型感知嵌入的零样本命名实体检索 / NER Retriever: Zero-Shot Named Entity Retrieval with Type-Aware Embeddings
这篇论文提出了一种无需预定义实体类型、直接根据用户描述检索相关实体的新方法,通过优化大语言模型内部表示并训练轻量级网络,实现了高效且灵活的零样本实体检索。