arXiv ID:
2511.07464
Motif-2-12.7B 技术报告 / Motif 2 12.7B technical report
1️⃣ 一句话总结
这篇论文介绍了一个名为Motif-2-12.7B的新型高效开源大语言模型,它通过创新的分组差分注意力架构和系统级优化,在有限计算资源下实现了与更大模型相媲美的强大语言理解和指令执行能力。
Motif-2-12.7B 技术报告 / Motif 2 12.7B technical report
这篇论文介绍了一个名为Motif-2-12.7B的新型高效开源大语言模型,它通过创新的分组差分注意力架构和系统级优化,在有限计算资源下实现了与更大模型相媲美的强大语言理解和指令执行能力。
AI编码代理重构的实证研究 / Agentic Refactoring: An Empirical Study of AI Coding Agents
这项研究发现AI编码代理在软件开发中频繁执行重构任务,但主要进行变量重命名等局部优化,而非人类常见的大型设计重构,且能小幅改善代码结构质量。
初级AI科学家及其风险报告:基于基线论文的自主科学探索 / Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper
本研究开发了一个名为Jr. AI Scientist的自主AI科学家系统,它能模仿学生研究者的工作流程,在给定基线论文后自主提出新假设、进行实验并撰写论文,实验证明其成果优于现有全自动系统,但作者也指出了该系统存在的局限性和潜在风险,强调了人类专家在科研中不可替代的作用。
TWIST2:可扩展、便携且全面的人形机器人数据收集系统 / TWIST2: Scalable, Portable, and Holistic Humanoid Data Collection System
这篇论文提出了一个无需动作捕捉设备、成本低廉且便携的人形机器人数据收集系统TWIST2,它通过VR技术实现全身动作控制,并基于收集的数据开发出能够自主执行复杂任务的视觉运动策略,显著提升了人形机器人技能学习的效率和实用性。
TabTune:用于表格基础模型推理与微调的统一库 / TabTune: A Unified Library for Inference and Fine-Tuning Tabular Foundation Models
这篇论文提出了一个名为TabTune的统一工具库,旨在解决表格基础模型在实际应用中因接口不一致、预处理复杂和评估标准缺失等问题,通过提供标准化的流程支持多种模型和微调方法,以提升模型的可用性和评估效率。
Trove:一个灵活的密集检索工具包 / Trove: A Flexible Toolkit for Dense Retrieval
这篇论文介绍了一个名为Trove的开源工具包,它通过高效的数据管理和高度可定制化的设计,让用户能够轻松进行密集检索实验,同时显著降低内存消耗并提升处理速度。
Kinematify:高自由度铰接物体的开放词汇合成 / Kinematify: Open-Vocabulary Synthesis of High-DoF Articulated Objects
这篇论文提出了一个名为Kinematify的自动化框架,能够直接从任意RGB图像或文本描述中合成高自由度铰接物体的运动学模型,解决了从静态几何推断复杂关节结构和参数的关键难题。
LongCat-Flash-Omni 技术报告 / LongCat-Flash-Omni Technical Report
这篇论文介绍了一个名为LongCat-Flash-Omni的5600亿参数开源全模态模型,它通过渐进式训练策略,实现了低延迟的实时音视频交互,并在多种模态任务中达到了顶尖性能。
面向大语言模型系统的RDMA点对点通信 / RDMA Point-to-Point Communication for LLM Systems
这篇论文提出了名为TransferEngine的通用通信接口,解决了大语言模型系统中不同硬件间点对点通信不兼容的问题,实现了高性能、可移植的数据传输,并在多个实际应用中显著提升了效率。
代理组织时代:利用语言模型进行组织学习 / The Era of Agentic Organization: Learning to Organize with Language Models
这篇论文提出了一种名为异步思维的新方法,让多个AI代理通过动态分工和协作来解决复杂问题,不仅推理速度更快,还能在数学推理等任务上取得更好效果,并且学到的协作能力可以直接应用到新任务中。
请先 登录 后再提交论文