arXiv ID:
2604.25884
arXiv 提交日期: 2026-04-28
QCalEval:量子校准图理解的视觉语言模型基准测试 / QCalEval: Benchmarking Vision-Language Models for Quantum Calibration Plot Understanding
1️⃣ 一句话总结
该论文提出了首个专门评估视觉语言模型(VLM)理解量子计算校准图表能力的基准测试QCalEval,发现通用模型在零样本下表现尚可,但多图学习时开权重模型性能下降,而微调虽能提升零样本效果却无法弥补多模态上下文学习的差距。