arXiv ID:
2601.12910
arXiv 提交日期: 2026-01-19
SciCoQA:科学论文与代码一致性的质量保证 / SciCoQA: Quality Assurance for Scientific Paper--Code Alignment
1️⃣ 一句话总结
这篇论文提出了一个名为SciCoQA的新数据集,用于检测科学论文与其对应代码库之间的差异,以评估大型语言模型发现这类问题的能力,结果发现即使是当前最好的模型也难以准确识别大部分真实世界中的论文与代码不一致问题。