arXiv ID:
2601.09609
DPWriter:基于多样化规划分支强化学习的创意写作方法 / DPWriter: Reinforcement Learning with Diverse Planning Branching for Creative Writing
1️⃣ 一句话总结
这篇论文提出了一种结合多样化规划分支的强化学习框架,通过在半结构化思维链的规划阶段主动引入多样性,有效解决了大语言模型在创意写作等开放式任务中输出内容趋同的问题,在保持生成质量的同时显著提升了文本的多样性。