📄 论文总结
SemCoT:通过语义对齐的隐式标记加速思维链推理 / SemCoT: Accelerating Chain-of-Thought Reasoning through Semantically-Aligned Implicit Tokens
1️⃣ 一句话总结
这篇论文提出了一种名为SemCoT的新方法,通过将思维链推理过程压缩成语义对齐的隐式标记,在保持推理准确性的同时显著提升了大型语言模型的推理效率。
请先 登录 后再提交论文
SemCoT:通过语义对齐的隐式标记加速思维链推理 / SemCoT: Accelerating Chain-of-Thought Reasoning through Semantically-Aligned Implicit Tokens
这篇论文提出了一种名为SemCoT的新方法,通过将思维链推理过程压缩成语义对齐的隐式标记,在保持推理准确性的同时显著提升了大型语言模型的推理效率。
CodePlot-CoT:通过代码驱动图像进行数学视觉推理 / CodePlot-CoT: Mathematical Visual Reasoning by Thinking with Code-Driven Images
这项研究提出了一种利用代码生成图像辅助数学推理的新方法,通过构建大规模数据集和训练模型,显著提升了解决需要视觉辅助的数学问题的能力。
深度剪枝:消除轨迹间冗余的并行扩展方法 / DeepPrune: Parallel Scaling without Inter-trace Redundancy
这篇论文提出了一种名为DeepPrune的新方法,通过动态剪枝技术有效消除大语言模型并行推理过程中产生的冗余计算,能在保持准确率的同时将计算量减少80%以上。
PEAR:面向高效推理的阶段熵感知奖励机制 / PEAR: Phase Entropy Aware Reward for Efficient Reasoning
这篇论文提出了一种名为PEAR的奖励机制,通过分析模型在不同推理阶段的熵值变化,智能地鼓励模型生成更简洁但依然准确的推理过程,从而在不牺牲性能的前提下显著降低计算成本。
病理学思维链:从专家全切片图像诊断行为中学习视觉思维链代理 / Pathology-CoT: Learning Visual Chain-of-Thought Agent from Expert Whole Slide Image Diagnosis Behavior
这篇论文开发了一个名为Pathology-CoT的智能代理系统,它能通过记录专家在数字病理图像上的浏览行为来自动学习诊断思路,从而高效识别病变区域并做出可解释的诊断决策,在淋巴结转移检测任务中表现优于现有先进模型。
SciReasoner:跨学科科学推理基础模型 / SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines
这篇论文提出了一个跨学科的科学推理基础模型,能够将自然语言与多种科学数据格式对齐,并通过大规模预训练和强化学习技术,在科学翻译、知识提取、性质预测等上百个任务中实现比专业系统更广泛的覆盖和更强的泛化能力。
MMR1:通过方差感知采样与开放资源增强多模态推理 / MMR1: Enhancing Multimodal Reasoning with Variance-Aware Sampling and Open Resources
该论文提出了一种方差感知采样方法来解决多模态模型强化学习训练不稳定的问题,并发布了大规模高质量思维链数据和开源模型,显著提升了数学推理任务的性能。
理解推理模型的思维过程:基于舍恩菲尔德片段理论的视角 / Understanding the Thinking Process of Reasoning Models: A Perspective from Schoenfeld's Episode Theory
这篇论文通过引入人类数学问题解决的经典认知框架——舍恩菲尔德片段理论,首次为分析大型推理模型的思维过程提供了一个系统性的方法,并创建了一个公开的细粒度分析基准,揭示了模型推理中的认知状态转换模式,从而推动更可控、透明的推理系统发展。
EconProver:面向自动定理证明的更经济测试时扩展方法 / EconProver: Towards More Economical Test-Time Scaling for Automated Theorem Proving
本文提出了一种名为EconProver的经济型自动定理证明方法,通过动态思维链切换和并行强化学习技术,在保持性能的同时将计算成本降低至原有方法的12%。
FLUX-Reason-6M 与 PRISM-Bench:百万规模图文推理数据集与综合评测基准 / FLUX-Reason-6M & PRISM-Bench: A Million-Scale Text-to-Image Reasoning Dataset and Comprehensive Benchmark
该研究发布了一个包含600万张高质量生成图片的图文推理数据集FLUX-Reason-6M,并建立了包含七项评测维度的PRISM-Bench基准,旨在推动开源文生图模型在复杂推理能力上的发展。