arXiv ID:
2511.02778
VCode:一种以SVG作为符号视觉表示的多模态编码基准 / VCode: a Multimodal Coding Benchmark with SVG as Symbolic Visual Representation
1️⃣ 一句话总结
这篇论文提出了一个名为VCode的多模态编码基准,将图像理解任务转化为生成SVG代码的问题,并引入了一个评估方法和智能代理框架来提升模型在视觉符号表示上的准确性和推理能力。