arXiv ID:
2512.16301
智能体人工智能系统适应性的系统化框架 / Adaptation of Agentic AI
1️⃣ 一句话总结
本文提出了一个系统化的框架,将智能体AI系统的适应性研究统一为智能体适应和工具适应两个维度及其四种具体范式,旨在阐明设计空间、权衡取舍,并为构建更强大、高效、可靠的智能体系统提供概念基础和实践路线图。
智能体人工智能系统适应性的系统化框架 / Adaptation of Agentic AI
本文提出了一个系统化的框架,将智能体AI系统的适应性研究统一为智能体适应和工具适应两个维度及其四种具体范式,旨在阐明设计空间、权衡取舍,并为构建更强大、高效、可靠的智能体系统提供概念基础和实践路线图。
LoPA:通过前瞻并行解码扩展扩散大语言模型推理 / LoPA: Scaling dLLM Inference via Lookahead Parallel Decoding
这篇论文提出了一种名为LoPA的无训练即插即用算法,通过并行探索不同的候选令牌填充顺序并选择未来并行潜力最高的路径,将扩散大语言模型单次前向传递生成的令牌数量大幅提升至10个以上,从而显著加速了模型推理速度。
INTELLECT-3:技术报告 / INTELLECT-3: Technical Report
这篇论文介绍了INTELLECT-3,一个拥有1060亿参数的高效混合专家模型,它通过大规模强化学习训练,在数学、代码、科学和推理等多个基准测试中取得了同规模模型的最佳性能,并且作者开源了完整的模型及配套的训练基础设施。
ModelTables:面向AI模型的大规模结构化表格语料库 / ModelTables: A Corpus of Tables about Models
本文提出了ModelTables,这是首个专门用于描述AI模型的大规模结构化表格基准数据集,它通过整合Hugging Face模型卡、GitHub代码库和学术论文,构建了一个包含超过6万个模型和9万个表格的语料库,并引入了一套基于开发者行为的多源真实相关性标注,为模型理解、表格搜索和知识发现等任务提供了高质量的数据基础和评估标准。
去上下文作为防御:扩散变换器中的安全图像编辑 / DeContext as Defense: Safe Image Editing in Diffusion Transformers
这篇论文提出了一种名为DeContext的新方法,通过向图像添加微小的针对性扰动来干扰扩散模型中的跨注意力机制,从而有效阻止未经授权的图像编辑,保护个人照片不被恶意篡改,同时保持图像质量。
自动驾驶中的视觉-语言-动作模型:过去、现在与未来 / Vision-Language-Action Models for Autonomous Driving: Past, Present, and Future
这篇论文系统梳理了自动驾驶技术从传统模块化框架到新型视觉-语言-动作(VLA)模型的发展历程,指出VLA模型通过整合视觉感知、语言推理和动作生成,为实现更可解释、更通用且更符合人类意图的自动驾驶系统提供了新方向。
Make-It-Poseable:用于3D人形角色动画的前馈式潜在姿态生成模型 / Make-It-Poseable: Feed-forward Latent Posing Model for 3D Humanoid Character Animation
这篇论文提出了一种名为Make-It-Poseable的新方法,它通过直接在模型的潜在表示空间中进行操作来为3D角色生成新姿态,从而避免了传统方法中常见的皮肤权重预测不准、模型变形不自然等问题,显著提升了角色动画的质量和灵活性。
毒性预警:预测GitHub对话的脱轨 / Toxicity Ahead: Forecasting Conversational Derailment on GitHub
这篇论文通过分析GitHub讨论中的对话模式,开发了一种基于大语言模型的两步提示框架,能够有效预测开源社区对话何时会演变为有害互动,从而为主动、可解释的内容审核提供了新工具。
迈向无缝交互:交互式3D对话头部动态的因果轮次建模 / Towards Seamless Interaction: Causal Turn-Level Modeling of Interactive 3D Conversational Head Dynamics
这篇论文提出了一个名为TIMAR的新方法,它能够像真人对话一样,实时、连贯地生成虚拟人物或机器人的头部动作和表情,让交互看起来更自然。
DEER:用扩散模型生成草稿,用自回归模型验证 / DEER: Draft with Diffusion, Verify with Autoregressive Models
这篇论文提出了一种名为DEER的新方法,它使用能并行生成的扩散模型来快速“猜”出后续文本,再用更准确但较慢的自回归模型进行验证和修正,从而在保证大语言模型回答质量的同时,大幅提升了文本生成的速度。
请先 登录 后再提交论文