arXiv最新AI论文速览速学

📄

提交新论文

AI论文阅读

搜索范围：

所有标签

📄

2510.26658

🤖 系统

11-02 11:24

llm agents

concurrent reasoning agent organization reasoning efficiency reinforcement learning zero-shot generalization

📄 论文总结

异步思维：通过代理组织实现并发推理的新范式 / AsyncThink: A New Paradigm for Concurrent Reasoning through Agentic Organization

1️⃣ 一句话总结

本文提出了异步思维（AsyncThink）新范式，通过组织者-工作者协议实现大语言模型的并发推理，相比并行思维降低28%推理延迟并提高准确率，且具备零样本泛化能力。

2️⃣ 论文创新点

1. 异步思维范式

创新点：允许大语言模型将其内部思考组织成可并发执行的结构，通过组织者动态分配子查询、合并中间知识来构建并发执行的思维结构
区别/改进：相比并行思维降低28%推理延迟并提高准确率
意义：实现代理组织协作解决复杂问题，超越个体智能极限

2. 两阶段训练方法

创新点：先进行格式微调学习AsyncThink语法，再用强化学习优化，结合格式合规性和思维并发性的奖励机制
区别/改进：解决了监督微调阶段只能模仿格式而不能产生正确答案的局限性
意义：使模型能在未见任务上零样本泛化异步思维能力

3. 组织者-工作者协议

创新点：包含组织者和工作者两种角色的思考协议，组织者管理思考过程，工作者执行子查询，通过Fork、Join、Think、Answer四种文本动作管理思考过程
区别/改进：相比顺序思考提高了思考效率，支持动态生成执行结构
意义：为语言模型提供了统一的思考范式框架

3️⃣ 主要结果与价值

结果亮点

在数学推理任务（AMC-23和AIME-24）上，AsyncThink在保持竞争力的整体性能的同时显著降低了关键路径延迟
在4×4数独任务上获得89.4%准确率的同时，延迟仅为2853.0，优于并行思维的3694.7
思考并发性稳步增加而延迟减少，实现了效率与效果的双重优势

实际价值

为未来评估非顺序思维方法提供了重要的性能考量维度
证明了学习到的异步思维能力可以泛化到训练任务之外的领域
为研究智能体协作和并发操作提供了理论基础和基础框架

4️⃣ 术语表

AsyncThink：异步思维，基于组织者-工作者协议的异步思考框架，支持并行思考和动态执行结构生成，允许LLM将其内部思考组织成可并发执行的结构
agentic organization：代理组织，多个代理协作解决复杂问题的组织系统
组织者-工作者协议：AsyncThink的核心机制，组织者负责分配任务，工作者并行处理子查询
Critical-Path Latency：关键路径延迟，异步思维所需的最小顺序深度，代表推理时间的理论下界，反映组织者与工作者通信开销对性能的影响
Fork-Join：异步思考中的核心操作，Fork用于分发子任务，Join用于合并思考结果，是一种并发编程模式
GRPO：组相对策略优化，用于强化学习的策略优化方法
Multi-Solution Countdown：多解倒计时任务，要求从给定数字集中找到恰好四个不同解

✓ 标记为已读 ☆ 收藏 📌 待读展开

📄 打开原文 PDF

📚 arXiv最新AI论文速览速学

菜单

提交新论文

2510.26658

📄 论文总结

1️⃣ 一句话总结

2️⃣ 论文创新点

1. 异步思维范式

2. 两阶段训练方法

3. 组织者-工作者协议

3️⃣ 主要结果与价值

结果亮点

实际价值

4️⃣ 术语表

密码管理

设置密码

修改密码

移除密码

菜单

提交新论文

需要登录

2510.26658 📝

📄 论文总结

1️⃣ 一句话总结

2️⃣ 论文创新点

1. 异步思维范式

2. 两阶段训练方法

3. 组织者-工作者协议

3️⃣ 主要结果与价值

结果亮点

实际价值

4️⃣ 术语表

获取最新论文摘要

2510.26658