← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
详细标签: research synthesis automated evaluation retrieval-augmented generation citation verification knowledge synthesis 或 搜索:

📄 论文总结

DeepScholar-Bench:生成式研究合成系统的实时基准与自动化评估框架

DeepScholar-Bench: A Real-Time Benchmark and Automated Evaluation Framework for Generative Research Synthesis Systems


1️⃣ 一句话总结

本文提出了DeepScholar-Bench,一个专为评估生成式研究合成系统设计的实时基准数据集和自动化多维评估框架,通过知识合成、检索质量和可验证性三个维度全面衡量系统性能,并开发了DeepScholar-base作为高效基线系统。


2️⃣ 论文创新点

1. 实时基准数据集

2. 三维自动化评估框架

3. DeepScholar-base基线系统


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF