arXiv最新AI论文速览速学

🔍

标签: #svg generation ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 97 72小时内新更新论文 72h更新 97 最新: HandwritingAgent: Language-Driven Handwriting Synthesis in Scalable Vector Space 06-22

arXiv ID: 2606.18788

arXiv 提交日期: 2026-06-17

llm agents multi-modal handwriting synthesis svg generation language-driven style imitation multi-lingual

手写智能体：在可缩放矢量空间中基于语言驱动的手写合成 / HandwritingAgent: Language-Driven Handwriting Synthesis in Scalable Vector Space

1️⃣ 一句话总结

本文提出了一种名为HandwritingAgent的智能系统，它无需针对特定风格进行训练，仅通过自然语言指令和参考手写样例，就能在矢量图形格式中自动生成逼真、多变的手写笔画序列，并且效果优于现有方法，可广泛应用于模仿、识别、多语言乃至复杂数学公式的手写生成。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.05072

arXiv 提交日期: 2026-04-06

natural language processing multi-modal model training svg generation tokenization vector graphics program synthesis autoregressive modeling

分层SVG标记化：学习用于可缩放矢量图形建模的紧凑视觉程序 / Hierarchical SVG Tokenization: Learning Compact Visual Programs for Scalable Vector Graphics Modeling

1️⃣ 一句话总结

这篇论文提出了一种名为HiVG的新方法，它通过一种分层的标记化技术，让AI在生成矢量图形（如SVG格式的图标或插图）时，能更高效、更准确地理解和构建图形的几何结构，从而减少错误并提升生成质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21461

arXiv 提交日期: 2026-02-25

natural language processing computer vision multi-modal vector graphics generation svg generation font design multimodal language model typography

VecGlypher：基于语言模型的统一矢量字形生成 / VecGlypher: Unified Vector Glyph Generation with Language Models

1️⃣ 一句话总结

这篇论文提出了一个名为VecGlypher的多模态语言模型，它能够根据文字描述或参考图片直接生成高质量、可编辑的矢量字形，从而大大降低了字体设计的门槛。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.10894

arXiv 提交日期: 2025-12-11

multi-modal computer vision model training svg generation multimodal generation visual guidance vector graphics vision-language model

DuetSVG：基于内部视觉引导的统一多模态SVG生成 / DuetSVG: Unified Multimodal SVG Generation with Internal Visual Guidance

1️⃣ 一句话总结

这篇论文提出了一种名为DuetSVG的新方法，它通过同时生成图像和SVG代码，并利用模型自身的视觉预测来引导生成过程，从而解决了现有技术在生成复杂、美观且几何一致的矢量图形时遇到的困难。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.02778

arXiv 提交日期: 2025-11-04

multi-modal benchmark agents svg generation visual reasoning code generation multimodal understanding evaluation protocol

VCode：一种以SVG作为符号视觉表示的多模态编码基准 / VCode: a Multimodal Coding Benchmark with SVG as Symbolic Visual Representation

1️⃣ 一句话总结

这篇论文提出了一个名为VCode的多模态编码基准，将图像理解任务转化为生成SVG代码的问题，并引入了一个评估方法和智能代理框架来提升模型在视觉符号表示上的准确性和推理能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.18788

1️⃣ 一句话总结

arXiv ID: 2604.05072

1️⃣ 一句话总结

arXiv ID: 2602.21461

1️⃣ 一句话总结

arXiv ID: 2512.10894

1️⃣ 一句话总结

arXiv ID: 2511.02778

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.18788 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.05072 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21461 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.10894 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.02778 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.18788

arXiv ID: 2604.05072

arXiv ID: 2602.21461

arXiv ID: 2512.10894

arXiv ID: 2511.02778