arXiv ID:
2601.09274
A^3-Bench:通过锚点与吸引子激活来评测记忆驱动的科学推理 / $A^3$-Bench: Benchmarking Memory-Driven Scientific Reasoning via Anchor and Attractor Activation
1️⃣ 一句话总结
这篇论文提出了一个新的评测基准A^3-Bench,它通过测量模型在科学推理中激活和利用先验知识(锚点)与经验结构(吸引子)的能力,来评估其记忆驱动的推理水平,而不仅仅是看最终答案的对错。