← 返回列表

菜单

🤖 系统
📄 Abstract - Ling 2.0: A Reasoning-Oriented Large-Scale Language Foundation Model Series
正在获取摘要...
顶级标签: llm theory
详细标签: mixture-of-experts scaling laws reasoning sparse activation model efficiency 或 搜索:

📄 论文总结

Ling 2.0:面向推理的大规模语言基础模型系列 / Ling 2.0: A Reasoning-Oriented Large-Scale Language Foundation Model Series


1️⃣ 一句话总结

Ling 2.0是一个基于'每个激活都提升推理能力'原则设计的大规模混合专家模型系列,通过统一MoE架构、Ling缩放定律和算法-基础设施协同设计,在保持高稀疏性的同时实现了从百亿到万亿参数的可扩展扩展,相比密集模型达到7倍效率提升。


2️⃣ 论文创新点

1. 统一MoE架构与高稀疏设计

2. Ling缩放定律

3. 风洞外推框架

4. 推理导向数据组合

5. 进化思维链


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF