arXiv ID:
2606.26563
arXiv 提交日期: 2026-06-25
scBench-Long:长程单细胞生物学的可验证基准测试 / scBench-Long: Verifiable Benchmarking of Long-Horizon Single-Cell Biology
1️⃣ 一句话总结
本文提出了一个名为scBench-Long的基准测试,旨在评估AI系统能否像科学家一样,从单细胞原始数据出发,通过多步骤的复杂分析,最终得出有科学依据的结论。