← 返回列表

菜单

🤖 系统
📄 Abstract - AdaR: Adaptive Reasoning Framework for Enhancing Robustness and Generalization of LLMs in Mathematical Reasoning
正在获取摘要...
顶级标签: llm
详细标签: mathematical reasoning adaptive reasoning robustness synthetic data reinforcement learning 或 搜索:

📄 论文总结

自适应推理框架AdaR:提升LLMs在数学推理中的鲁棒性和泛化能力 / AdaR: Adaptive Reasoning Framework for Enhancing Robustness and Generalization of LLMs in Mathematical Reasoning


1️⃣ 一句话总结

AdaR是一个通过合成高质量扰动数据和强化学习验证奖励训练来引导大语言模型进行自适应推理的框架,显著提升了数学推理任务的鲁棒性和泛化能力。


2️⃣ 论文创新点

1. 自适应推理框架设计

2. 可控扰动与完整性检查机制

3. RLVR与合成数据结合的训练策略


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF