arXiv ID:
2605.13773
arXiv 提交日期: 2026-05-13
大语言模型如何理解高级消息序列图? / (How) Do Large Language Models Understand High-Level Message Sequence Charts?
1️⃣ 一句话总结
本文测试了三种主流大语言模型在理解高级消息序列图(一种用于软件架构设计的可视化模型)的语义时的表现,发现它们对基本概念理解尚可(准确率约88%),但在处理抽象、组合等复杂语义推理任务时表现较差(准确率约36%),整体准确率仅约52%,表明当前LLM对这类形式化规约的理解仍非常有限。