arXiv ID:
2604.19667
arXiv 提交日期: 2026-04-21
Chat2Workflow:用自然语言生成可执行可视化工作流的基准测试 / Chat2Workflow: A Benchmark for Generating Executable Visual Workflows with Natural Language
1️⃣ 一句话总结
本文提出了一个名为Chat2Workflow的基准测试,用于评估大语言模型能否从自然语言描述中自动生成可直接部署的可视化工作流,并设计了一个智能体框架来减少常见错误,实验表明当前模型虽能理解高层意图但生成稳定可执行的工作流仍有很大挑战。