重新审视视觉推理泛化中冗长思维链的必要性 / Revisiting the Necessity of Lengthy Chain-of-Thought in Vision-centric Reasoning Generalization
1️⃣ 一句话总结
这项研究发现,在训练视觉语言模型进行视觉推理时,使用简短且仅包含关键定位步骤的思维链数据,比使用冗长或包含图像操作的复杂思维链,能带来更好的泛化能力和最终性能。
请先 登录 后再提交论文
重新审视视觉推理泛化中冗长思维链的必要性 / Revisiting the Necessity of Lengthy Chain-of-Thought in Vision-centric Reasoning Generalization
这项研究发现,在训练视觉语言模型进行视觉推理时,使用简短且仅包含关键定位步骤的思维链数据,比使用冗长或包含图像操作的复杂思维链,能带来更好的泛化能力和最终性能。
Motif-2-12.7B 技术报告 / Motif 2 12.7B technical report
这篇论文介绍了一个名为Motif-2-12.7B的新型高效开源大语言模型,它通过创新的分组差分注意力架构和系统级优化,在有限计算资源下实现了与更大模型相媲美的强大语言理解和指令执行能力。
SIMS-V:面向空间视频理解的模拟指令调优 / SIMS-V: Simulated Instruction-Tuning for Spatial Video Understanding
该论文提出了一种利用3D模拟器生成空间丰富视频数据的方法,仅需少量模拟示例就能有效训练视频语言模型,使其在现实世界空间推理任务中超越更大模型并媲美商业模型。
VidEmo:面向情感中心视频基础模型的情感树推理 / VidEmo: Affective-Tree Reasoning for Emotion-Centric Video Foundation Models
这项研究提出了一种名为VidEmo的视频情感基础模型,通过分阶段的课程情感学习和情感树强化学习,结合一个包含210万条指令样本的精细数据集,有效解决了视频中复杂动态情感理解与推理的难题,并在多个任务上取得了领先性能。
CLASS-IT:面向BabyLMs的对话与讲座对齐小规模指令调优 / CLASS-IT: Conversational and Lecture-Aligned Small-Scale Instruction Tuning for BabyLMs
这项研究发现,对小规模语言模型进行指令调优能在特定任务上带来小幅但稳定的性能提升,但难以直接迁移到零样本场景,揭示了模型在交互适应与广泛语言泛化之间的权衡。
基于渐进难度增强机制的Web智能体数据合成方法 / Synthesizing Agentic Data for Web Agents with Progressive Difficulty Enhancement Mechanisms
这篇论文提出了一种通过逐步增加任务难度来合成高质量训练数据的方法,使得训练出的网络智能体在复杂问答任务中表现更优,同时避免了重复工具使用行为。
LLaMAX2:你的翻译增强模型在推理任务上同样表现出色 / LLaMAX2: Your Translation-Enhanced Model also Performs Well in Reasoning
这篇论文提出了一种新的翻译增强方法,通过指令模型和分层选择性调优,使模型在提升多语言翻译能力的同时,依然保持了强大的推理性能。
MM-HELIX:通过整体平台与自适应混合策略优化提升多模态长链反思推理能力 / MM-HELIX: Boosting Multimodal Long-Chain Reflective Reasoning with Holistic Platform and Adaptive Hybrid Policy Optimization
本研究提出了MM-HELIX多模态长链反思推理基准和自适应混合策略优化方法,显著提升了多模态大模型在需要反复思考和回溯的复杂任务上的推理能力。
SciReasoner:跨学科科学推理基础模型 / SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines
这篇论文提出了一个跨学科的科学推理基础模型,能够将自然语言与多种科学数据格式对齐,并通过大规模预训练和强化学习技术,在科学翻译、知识提取、性质预测等上百个任务中实现比专业系统更广泛的覆盖和更强的泛化能力。
SearchInstruct:通过基于检索的指令数据集创建增强领域适应性 / SearchInstruct: Enhancing Domain Adaptation via Retrieval-Based Instruction Dataset Creation
这篇论文提出了一种名为SearchInstruct的创新方法,它利用少量人工问题和大型语言模型自动扩展问题,并结合检索相关领域资源来生成高质量指令数据集,从而有效提升大语言模型在特定领域的适应性和性能。