🤖 系统
11-30 17:52
📄 论文总结
MathSE:通过自演进迭代反思与奖励引导微调提升多模态数学推理能力 / MathSE: Improving Multimodal Mathematical Reasoning via Self-Evolving Iterative Reflection and Reward-Guided Fine-Tuning
1️⃣ 一句话总结
这篇论文提出了一个名为MathSE的自演进框架,通过推理、反思和奖励反馈的循环迭代,显著提升了多模态大语言模型在复杂数学问题上的解决能力。