arXiv ID:
2604.01554
arXiv 提交日期: 2026-04-02
EXHIB:一个用于在真实复杂场景下评估函数相似性的现实且多样化的基准 / EXHIB: A Benchmark for Realistic and Diverse Evaluation of Function Similarity in the Wild
1️⃣ 一句话总结
这篇论文提出了一个名为EXHIB的新基准,它通过五个真实数据集全面评估二进制函数相似性检测模型,发现现有模型在面对现实世界软件的多样性时性能会大幅下降,揭示了当前评估方法的重大缺陷。