← 返回列表

菜单

🤖 系统
📄 Abstract - Efficient Mathematical Reasoning via Implicit Regularization with Medium-Difficulty Problems
正在获取摘要...
顶级标签: llm
详细标签: mathematical reasoning implicit regularization reinforcement learning efficiency metrics curriculum learning 或 搜索:

📄 论文总结

基于中等难度问题隐式正则化的高效数学推理模型 / Efficient Mathematical Reasoning via Implicit Regularization with Medium-Difficulty Problems


1️⃣ 一句话总结

本研究提出通过保留并适当加权中等难度问题作为隐式长度正则化器的方法,在保持数学推理准确率的同时显著缩短模型输出长度,实现了无需显式惩罚的'涌现简洁性'。


2️⃣ 论文创新点

1. 隐式长度正则化

2. GRPO优化方法

3. 课程RLVR训练

4. 效率调整准确率(EAA)


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF