← 返回列表

菜单

🤖 系统
📄 Abstract - SciReasoner
正在获取摘要...
详细标签: scientific reasoning chain-of-thought reinforcement learning molecular representation multi-task learning 或 搜索:

📄 论文总结

科学推理基础模型

SciReasoner


1️⃣ 一句话总结

SciReasoner是一个通过统一框架整合自然语言与多种科学表示的科学推理基础模型,在预训练、指令微调和推理强化学习三阶段训练下,在多个科学任务上实现了卓越性能。


2️⃣ 论文创新点

1. 自适应科学推理

2. 任务分组奖励

3. 科学奖励软化

4. 多模态科学数据整合

5. 推理强化学习


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF