🤖 系统
11-30 17:25
📄 论文总结
DeepScholar-Bench:一个用于生成式研究合成的实时基准与自动评估框架 / DeepScholar-Bench: A Live Benchmark and Automated Evaluation for Generative Research Synthesis
1️⃣ 一句话总结
这篇论文提出了一个名为DeepScholar-Bench的实时基准测试和自动化评估框架,专门用于衡量AI系统在检索、整合并引用网络文献以生成长篇研究综述(如论文相关章节)方面的能力,并通过评估发现当前系统在此复杂任务上仍有很大提升空间。