← 返回列表

菜单

🤖 系统
📄 Abstract - SurveyBench: A Benchmark Framework for Evaluating LLM-Generated Academic Survey Capabilities
正在获取摘要...
顶级标签: llm
详细标签: academic survey generation quiz-based evaluation rag llm-as-judge content richness 或 搜索:

📄 论文总结

SurveyBench:用于评估大语言模型自动生成学术综述能力的基准框架

SurveyBench: A Benchmark Framework for Evaluating LLM-Generated Academic Survey Capabilities


1️⃣ 一句话总结

SurveyBench是一个细粒度、测试驱动的评估框架,用于全面评估大语言模型自动生成学术综述的能力,解决了现有方法在引用平衡性、内容覆盖深度和洞察力等方面的不足。


2️⃣ 论文创新点

1. SurveyBench评估框架

2. 多维度评估指标体系

3. 基于测试的综述评估方法


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF