arXiv ID:
2602.09163
arXiv 提交日期: 2026-02-09
FlyAOC:评估AI代理在果蝇科学知识库中的本体论策展能力 / FlyAOC: Evaluating Agentic Ontology Curation of Drosophila Scientific Knowledge Bases
1️⃣ 一句话总结
本文提出了FlyAOC基准测试,用于评估AI代理从大量科学文献中自主检索、阅读并生成结构化基因本体注释的端到端能力,实验表明多代理架构在性能上优于其他基线,但所有方法仍有较大改进空间。