arXiv ID:
2602.09163
arXiv 提交日期: 2026-02-09
FlyAOC:评估果蝇科学知识库的智能体本体论构建 / FlyAOC: Evaluating Agentic Ontology Curation of Drosophila Scientific Knowledge Bases
1️⃣ 一句话总结
这篇论文提出了一个名为FlyBench的新基准测试,用于评估AI智能体如何像专家一样,从海量科学文献中自动搜索、阅读并整理出关于果蝇基因的结构化知识,发现多智能体架构表现更好,但仍远未达到专家水平,为未来AI辅助科学研究指明了方向。