arXiv最新AI论文速览速学

🔍

标签: #medical benchmark ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: MEDSYN: Benchmarking Multi-EviDence SYNthesis in Complex Clinical Cases for Multimodal Large Language Models 03-02

arXiv ID: 2602.21950

arXiv 提交日期: 2026-02-25

medical multi-modal benchmark multimodal llms clinical diagnosis medical benchmark evidence synthesis model evaluation

MEDSYN：针对多模态大语言模型的复杂临床病例多证据合成基准测试 / MEDSYN: Benchmarking Multi-EviDence SYNthesis in Complex Clinical Cases for Multimodal Large Language Models

1️⃣ 一句话总结

这篇论文提出了一个名为MEDSYN的新基准测试，用于评估多模态大语言模型在整合多种复杂临床证据（如图像和文本）以进行准确诊断方面的能力，发现当前模型在综合不同类型证据方面存在明显缺陷，并提出了量化这种缺陷的方法以指导模型改进。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.25628

arXiv 提交日期: 2025-10-29

medical llm model training electronic health records clinical reasoning domain adaptation medical benchmark reinforcement learning

EHR-R1：一种用于电子健康记录分析的推理增强基础语言模型 / EHR-R1: A Reasoning-Enhanced Foundational Language Model for Electronic Health Record Analysis

1️⃣ 一句话总结

这篇论文开发了一个名为EHR-R1的增强推理大语言模型，通过大规模数据集和专门训练方法，在电子健康记录分析任务上显著超越了现有先进模型，提升了临床决策的准确性和可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.06888

arXiv 提交日期: 2025-10-08

medical benchmark multi-modal multimodal retrieval medical benchmark retrieval-augmented generation healthcare ai cross-modal retrieval

M3Retrieve：医学多模态检索基准测试 / M3Retrieve: Benchmarking Multimodal Retrieval for Medicine

1️⃣ 一句话总结

这篇论文提出了一个名为M3Retrieve的医学多模态检索基准，旨在填补医疗领域缺乏标准评估工具的空白，通过包含超过120万份文本和16.4万条多模态查询的数据集，系统评估现有模型在不同医学专科和任务中的表现，以推动更可靠医疗检索系统的发展。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.21950

1️⃣ 一句话总结

arXiv ID: 2510.25628

1️⃣ 一句话总结

arXiv ID: 2510.06888

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.21950 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.25628 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.06888 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.21950

arXiv ID: 2510.25628

arXiv ID: 2510.06888