🤖 系统
12-04 14:23
PretrainZero:强化主动预训练 / PretrainZero: Reinforcement Active Pretraining
1️⃣ 一句话总结
这篇论文提出了一个名为PretrainZero的强化学习框架,它能让大语言模型像人类一样主动从海量无标签文本中学习,无需依赖特定领域的奖励信号,从而显著提升了模型在数学、科学等领域的通用推理能力。
请先 登录 后再提交论文
PretrainZero:强化主动预训练 / PretrainZero: Reinforcement Active Pretraining
这篇论文提出了一个名为PretrainZero的强化学习框架,它能让大语言模型像人类一样主动从海量无标签文本中学习,无需依赖特定领域的奖励信号,从而显著提升了模型在数学、科学等领域的通用推理能力。
属性作为文本基因:利用大语言模型作为遗传算法模拟器进行条件性合成数据生成 / Attributes as Textual Genes: Leveraging LLMs as Genetic Algorithm Simulators for Conditional Synthetic Data Generation
这篇论文提出了一种名为'遗传提示'的新方法,通过将文本属性视为基因并利用大语言模型模拟遗传算法中的交叉和变异操作,有效提升了合成数据的质量和多样性,在多种自然语言处理任务中显著优于现有技术。