arXiv ID:
2601.21339
arXiv 提交日期: 2026-01-29
大语言模型在创意任务中的模型内与提示间变异性研究 / Within-Model vs Between-Prompt Variability in Large Language Models for Creative Tasks
1️⃣ 一句话总结
这篇论文通过大规模实验发现,在评估大语言模型的创意能力时,提示语对输出质量(如原创性)的影响与模型选择相当,但对输出数量(如流畅度)影响很小,同时模型内部因随机采样产生的波动很大,因此仅凭单次测试结果可能误导对模型或提示语真实效果的判断。