🤖 系统
11-30 17:36
📄 论文总结
SurveyBench:大语言模型(智能体)能否撰写符合读者需求的学术综述? / SurveyBench: Can LLM(-Agents) Write Academic Surveys that Align with Reader Needs?
1️⃣ 一句话总结
这篇论文提出了一个名为SurveyBench的评估框架,通过设计精细的指标和测试方法,系统地检验大语言模型自动撰写学术综述的能力是否满足读者需求,发现现有方法在内容质量上仍显著低于人类水平。