arXiv ID:
2601.00575
arXiv 提交日期: 2026-01-02
InfoSynth:面向大语言模型的信息引导式基准测试合成框架 / InfoSynth: Information-Guided Benchmark Synthesis for LLMs
1️⃣ 一句话总结
这篇论文提出了一种名为InfoSynth的自动化框架,它利用信息论原理和遗传算法,能够高效地生成新颖且多样化的编程问题来测试大语言模型的能力,解决了传统人工创建测试集成本高、易被模型‘见过’的难题。