arXiv ID:
2604.12615
arXiv 提交日期: 2026-04-14
DeepTest工具竞赛2026:基于大语言模型的汽车助手基准测试 / DeepTest Tool Competition 2026: Benchmarking an LLM-Based Automotive Assistant
1️⃣ 一句话总结
这篇论文介绍了2026年ICSE会议上举办的首届大语言模型测试竞赛,通过让四个测试工具挑战一个基于大语言模型的汽车手册问答应用,来评估它们发现系统遗漏安全警告等缺陷的能力和测试用例的多样性。