arXiv最新AI论文速览速学

📄

提交新论文

AI论文阅读

搜索范围：

所有标签

📄

2509.00244

🤖 系统

09-03 15:30

agents llm systems

automated research tool usage code generation agent architecture execution safety

📄 论文总结

通用深度研究：自带模型与策略

Universal Deep Research: Bring Your Own Model and Strategy

1️⃣ 一句话总结

UDR是一个通用型深度研究系统，允许用户使用任意语言模型创建和执行完全自定义的研究策略，无需额外训练或微调，通过将自然语言策略转换为可执行代码实现高效、安全且透明的自动化研究流程。

2️⃣ 论文创新点

1. 通用深度研究系统架构

创新点是什么：UDR系统可封装任意语言模型，支持用户完全自定义深度研究策略，无需模型重训练或微调
与已有方法的区别/改进：克服了现有DRT工具硬编码特定策略和固定工具的限制
为什么有意义：提供了研究策略的灵活性和可定制性，实现了模型与DRT工具的独立竞争

2. 基于代码片段的策略执行机制

创新点是什么：将用户定义的研究查询转换为可操作的代码片段，在允许的控制流和工具范围内执行
与已有方法的区别/改进：取代了传统的文档/页面概念，提供了完整的研究过程控制
为什么有意义：使用户能够定义复杂的研究、验证和报告结构化程序，实现完全的研究过程定制

3. 分阶段策略处理与执行

创新点是什么：将用户自然语言策略转换为可执行代码，并在隔离环境中执行
与已有方法的区别/改进：替代了直接嵌入策略或分步生成代码的脆弱方法
为什么有意义：确保步骤一致性，减少同步开销，避免级联失败

4. 外部状态管理

创新点是什么：使用代码变量而非LM上下文窗口存储中间信息
与已有方法的区别/改进：摆脱了单一增长上下文窗口的限制
为什么有意义：可在小上下文窗口（8k token）中完成复杂工作流

5. 双级效率机制

创新点是什么：将编排逻辑委托给CPU可执行代码，限制LLM仅用于聚焦的上下文高效调用
与已有方法的区别/改进：相比传统DRT显著降低GPU使用率和延迟
为什么有意义：大幅减少深度研究任务的总体延迟和成本

6. 沙箱化执行环境

创新点是什么：默认在隔离环境中执行生成代码，防止主机系统访问
与已有方法的区别/改进：使用Piston等现成解决方案提供执行隔离
为什么有意义：确保UDR部署安全，防范提示注入和代码利用风险

3️⃣ 主要结果与价值

实验结果亮点

通过代码生成和执行的纪律性结构，显著提高了研究策略的忠实度和一致性
在仅8k token上下文窗口内高效完成复杂研究工作流
使用Llama 3.3 70B模型成功处理技术查询并生成结构化报告

实际应用价值

为高价值行业自动化专业研究工作负载提供了可能
大幅降低深度研究任务的延迟和计算成本
提供实时进度通知和用户可审计的执行视图，增强系统透明度

4️⃣ 术语表

Universal Deep Research (UDR)：通用深度研究系统，支持任意语言模型和自定义研究策略的代理系统
Deep Research Tool (DRT)：深度研究工具，接收研究提示，进行广泛搜索并生成结构化研究报告的代理系统
Graph-Based AI Architecture：基于图的AI架构，使用知识图表示企业数据并通过图神经网络进行访问
research strategy：研究策略，用户用自然语言编写的指导系统执行研究过程的指令集
PROMPT：用户提交的研究请求或指令，是驱动整个研究流程的初始输入
supercontext：存储所有搜索阶段读取的全部资源上下文的全局存储容器
subcontext：仅存储单次搜索交互上下文的局部存储容器
CONTEXT：单一的存储，在搜索过程中逐步累积来自搜索结果的信息内容，作为生成报告的知识基础

✓ 标记为已读 ☆ 收藏 📌 待读展开

📄 打开原文 PDF

📚 arXiv最新AI论文速览速学

菜单

提交新论文

2509.00244

📄 论文总结

1️⃣ 一句话总结

2️⃣ 论文创新点

1. 通用深度研究系统架构

2. 基于代码片段的策略执行机制

3. 分阶段策略处理与执行

4. 外部状态管理

5. 双级效率机制

6. 沙箱化执行环境

3️⃣ 主要结果与价值

实验结果亮点

实际应用价值

4️⃣ 术语表

密码管理

设置密码

修改密码

移除密码

菜单

提交新论文

需要登录

2509.00244 📝

📄 论文总结

1️⃣ 一句话总结

2️⃣ 论文创新点

1. 通用深度研究系统架构

2. 基于代码片段的策略执行机制

3. 分阶段策略处理与执行

4. 外部状态管理

5. 双级效率机制

6. 沙箱化执行环境

3️⃣ 主要结果与价值

实验结果亮点

实际应用价值

4️⃣ 术语表

获取最新论文摘要

2509.00244