arXiv ID:
2512.16676
arXiv 提交日期: 2025-12-18
DataFlow:一个统一、可扩展、由LLM驱动的数据准备框架 / DataFlow: An LLM-Driven Framework for Unified Data Preparation and Workflow Automation in the Era of Data-Centric AI
1️⃣ 一句话总结
论文提出了DataFlow,一个旨在解决当前大语言模型(LLM)数据准备流程碎片化问题的统一框架,它通过模块化、可组合的数据转换操作符和类似PyTorch的API,并结合智能代理DataFlow-Agent实现从自然语言描述自动生成可执行流水线,显著提升了数据准备的质量、效率和易用性。