arXiv ID:
2601.01739
K-EXAONE 技术报告 / K-EXAONE Technical Report
1️⃣ 一句话总结
LG AI Research开发了一个名为K-EXAONE的大型多语言专家混合模型,它在推理、代理、通用及多语言任务上表现出色,旨在作为强大的专有基础模型服务于广泛的工业和科研应用。
K-EXAONE 技术报告 / K-EXAONE Technical Report
LG AI Research开发了一个名为K-EXAONE的大型多语言专家混合模型,它在推理、代理、通用及多语言任务上表现出色,旨在作为强大的专有基础模型服务于广泛的工业和科研应用。
COMPASS:一个评估大语言模型组织特定政策对齐性的框架 / COMPASS: A Framework for Evaluating Organization-Specific Policy Alignment in LLMs
本文提出了首个名为COMPASS的系统性评估框架,用于检验大语言模型是否遵守企业内部的允许与禁止政策清单,研究发现现有模型在处理合规请求时表现良好,但在阻止违反禁令的对抗性请求时存在严重缺陷,揭示了它们在关键政策部署场景中缺乏必要的鲁棒性。
数字孪生人工智能:从大语言模型到世界模型的机遇与挑战 / Digital Twin AI: Opportunities and Challenges from Large Language Models to World Models
这篇论文提出了一个统一的四阶段框架,系统阐述了人工智能如何赋能数字孪生,使其从被动模拟工具转变为能够自主推理、预测和管理的智能认知系统,并探讨了其在多个领域的应用与挑战。
SWE-Lego:探索监督微调在软件问题解决任务中的性能极限 / SWE-Lego: Pushing the Limits of Supervised Fine-tuning for Software Issue Resolving
这篇论文提出了一个名为SWE-Lego的监督微调方案,通过构建高质量数据集和改进训练流程,证明了仅用轻量化的监督微调方法就能在软件工程问题解决任务上达到顶尖性能,并可通过测试时扩展进一步提升效果。
OpenNovelty:一个基于大语言模型、用于可验证学术新颖性评估的智能体系统 / OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment
这篇论文介绍了一个名为OpenNovelty的智能系统,它利用大语言模型自动检索和分析相关文献,为学术论文提供有据可查、可验证的新颖性评估报告,旨在辅助同行评审,使其更公平、一致和高效。
流等变世界模型:用于部分可观测动态环境的记忆 / Flow Equivariant World Models: Memory for Partially Observed Dynamic Environments
这篇论文提出了一种名为‘流等变世界模型’的新框架,它将智能体自身运动和外部物体运动统一为数学上的‘流’,从而让AI模型能更高效、稳定地理解和预测部分可见的动态环境,尤其在长时预测和视野外动态推理上表现优异。
面向大语言模型持续适应的记忆库压缩方法 / Memory Bank Compression for Continual Adaptation of Large Language Models
本文提出了一种名为MBC的新方法,它通过一种创新的压缩和优化策略,极大地缩小了外部记忆库的规模,从而让大语言模型在持续学习新知识时,既能高效更新、防止遗忘旧知识,又不会因数据不断涌入而导致存储开销无限增长。
ShowUI-π:基于流的生成模型作为图形用户界面的灵巧之手 / ShowUI-$π$: Flow-based Generative Models as GUI Dexterous Hands
这篇论文提出了一个名为ShowUI-π的新模型,它首次将基于流的生成模型用作图形界面的‘灵巧之手’,能够统一处理点击和拖拽等操作,在专门的拖拽任务基准测试中表现出色,显著提升了AI在数字环境中执行复杂、连续操作的能力。
递归语言模型 / Recursive Language Models
这篇论文提出了一种名为‘递归语言模型’的新方法,它能让大语言模型像编程一样,通过自我调用和分解的方式,高效处理远超其本身能力范围的超长文本,从而大幅提升长文本任务的处理效果。
Youtu-Agent:通过自动化生成与混合策略优化提升智能体生产力 / Youtu-Agent: Scaling Agent Productivity with Automated Generation and Hybrid Policy Optimization
这篇论文提出了一个名为Youtu-Agent的智能体框架,它能够自动生成并持续优化AI智能体,解决了传统方法配置成本高、能力僵化的问题,从而显著提升了智能体的生产效率和适应能力。
请先 登录 后再提交论文