🤖 系统
11-30 17:31
📄 论文总结
收益递减的错觉:衡量大语言模型的长程执行能力 / The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs
1️⃣ 一句话总结
这篇论文揭示了大语言模型在长任务中的表现并非收益递减,而是单步精度的微小提升能带来任务完成长度的指数级增长,并发现模型错误会自我强化,而‘思考’机制能有效缓解这一问题并显著扩展单次任务执行长度。