arXiv ID:
2602.21824
arXiv 提交日期: 2026-02-25
DocDjinn:基于视觉语言模型和手写扩散的可控合成文档生成框架 / DocDjinn: Controllable Synthetic Document Generation with VLMs and Handwriting Diffusion
1️⃣ 一句话总结
这篇论文提出了一个名为DocDjinn的新框架,它利用视觉语言模型和手写扩散技术,仅需少量真实文档作为“种子”,就能自动生成大量高质量、带标注的合成文档,有效解决了文档智能模型训练中数据稀缺和隐私保护的问题。