arXiv最新AI论文速览速学

📄

2512.02589

🤖 系统

12-05 14:38

llm agents systems

academic writing multi-agent system editor plugin model context protocol workflow automation

PaperDebugger：一个基于插件的多智能体系统，用于在编辑器内进行学术写作、审阅和编辑 / PaperDebugger: A Plugin-Based Multi-Agent System for In-Editor Academic Writing, Review, and Editing

1️⃣ 一句话总结

这篇论文提出了一个名为PaperDebugger的智能写作助手，它能直接嵌入到LaTeX编辑器内部，通过多个AI智能体协同工作，帮助用户在写作过程中进行实时修改、审阅和文献查找，解决了传统外部写作助手无法深度理解文档状态和结构的问题。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📄

2509.06917

🤖 系统

11-30 17:30

agents systems natural language processing

knowledge agents research automation model context protocol scientific workflows paper-to-agent

📄 论文总结

论文转智能体：将研究论文重新构想为交互式且可靠的AI智能体 / Paper2Agent: Reimagining Research Papers As Interactive and Reliable AI Agents

1️⃣ 一句话总结

这篇论文提出了一个名为Paper2Agent的自动化框架，能够将静态的研究论文转化为可交互的AI智能体，使读者能够通过自然语言直接调用论文中的方法和工具进行复杂科学查询，从而降低理解和使用研究成果的门槛。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📄

2508.20453

🤖 系统

11-30 17:26

llm agents benchmark

tool usage multi-step tasks model context protocol agent evaluation cross-domain coordination

📄 论文总结

MCP-Bench：通过MCP服务器对使用工具的LLM智能体在复杂现实任务中的基准测试 / MCP-Bench: Benchmarking Tool-Using LLM Agents with Complex Real-World Tasks via MCP Servers

1️⃣ 一句话总结

这篇论文提出了一个名为MCP-Bench的新基准测试，通过连接28个真实领域的工具服务器，评估大型语言模型在需要多步骤规划、工具协调和跨领域工作流的复杂现实任务中的表现，发现现有先进模型仍面临显著挑战。

👋 没兴趣 ☆ 感兴趣 📌 待读

📄 打开原文 PDF

📚 arXiv最新AI论文速览速学

菜单

提交新论文

2512.02589

1️⃣ 一句话总结

2509.06917

📄 论文总结

1️⃣ 一句话总结

2508.20453

📄 论文总结

1️⃣ 一句话总结

密码管理

设置密码

修改密码

移除密码

菜单

提交新论文

需要登录

2512.02589 📝

1️⃣ 一句话总结

2509.06917 📝

📄 论文总结

1️⃣ 一句话总结

2508.20453 📝

📄 论文总结

1️⃣ 一句话总结

获取最新论文摘要

2512.02589

2509.06917

2508.20453