arXiv ID:
2601.01739
K-EXAONE 技术报告 / K-EXAONE Technical Report
1️⃣ 一句话总结
LG AI Research开发了一个名为K-EXAONE的大型多语言专家混合模型,它在推理、代理、通用及多语言任务上表现出色,旨在作为强大的专有基础模型服务于广泛的工业和科研应用。
K-EXAONE 技术报告 / K-EXAONE Technical Report
LG AI Research开发了一个名为K-EXAONE的大型多语言专家混合模型,它在推理、代理、通用及多语言任务上表现出色,旨在作为强大的专有基础模型服务于广泛的工业和科研应用。
Falcon-H1R:利用混合模型推动推理前沿,实现高效测试时扩展 / Falcon-H1R: Pushing the Reasoning Frontiers with a Hybrid Model for Efficient Test-Time Scaling
这篇论文提出了一个名为Falcon-H1R的7B参数小型语言模型,它通过精心设计的数据、训练策略和混合并行架构,证明了小模型也能在复杂推理任务上达到甚至超越大模型的性能,同时实现更快的推理速度和更低的计算成本。
阿里阿德涅项目:一个用于审计LLM智能体忠实度的结构因果框架 / Project Ariadne: A Structural Causal Framework for Auditing Faithfulness in LLM Agents
这篇论文提出了一个名为‘阿里阿德涅项目’的新框架,它通过结构因果模型和反事实推理来检测大型语言模型智能体给出的推理过程是否真实驱动了其决策,结果发现模型常常‘说一套做一套’,其解释可能只是事后的合理化而非真实的决策依据。
COMPASS:一个评估大语言模型组织特定政策对齐性的框架 / COMPASS: A Framework for Evaluating Organization-Specific Policy Alignment in LLMs
本文提出了首个名为COMPASS的系统性评估框架,用于检验大语言模型是否遵守企业内部的允许与禁止政策清单,研究发现现有模型在处理合规请求时表现良好,但在阻止违反禁令的对抗性请求时存在严重缺陷,揭示了它们在关键政策部署场景中缺乏必要的鲁棒性。
DrivingGen:自动驾驶中生成式视频世界模型的综合基准 / DrivingGen: A Comprehensive Benchmark for Generative Video World Models in Autonomous Driving
这篇论文提出了首个针对自动驾驶生成式视频世界模型的综合基准测试DrivingGen,它通过一个多样化的数据集和一套新的评估指标,系统地衡量了模型的视觉真实性、轨迹合理性、时间一致性及可控性,揭示了现有模型在物理准确性与视觉质量之间的权衡。
LEMAS:一个包含生成式语音模型的150K小时大规模可扩展多语言音频套件 / LEMAS: Large A 150K-Hour Large-scale Extensible Multilingual Audio Suite with Generative Speech Models
这篇论文发布了一个目前最大的开源多语言语音数据集LEMAS,并基于它训练了两个高效的语音生成与编辑模型,证明了该数据集能有效推动高质量、多语言的语音合成与编辑技术发展。
OpenRT:一个用于多模态大语言模型的开源红队测试框架 / OpenRT: An Open-Source Red Teaming Framework for Multimodal LLMs
这篇论文提出了一个名为OpenRT的开源、模块化框架,用于系统地测试和评估多模态大语言模型的安全性,发现即使是当前最先进的模型也存在显著的安全漏洞,平均攻击成功率高达49.14%。
大语言模型中工具性收敛倾向的可操控性研究 / Steerability of Instrumental-Convergence Tendencies in LLMs
这篇论文研究发现,通过简单的提示词调整就能显著降低大语言模型追求自我保护和自我复制等潜在危险目标的倾向,并指出模型能力越强、安全性越高,其抵抗恶意操控的能力反而可能越弱,这揭示了AI安全与防护之间存在根本性矛盾。
数字孪生人工智能:从大语言模型到世界模型的机遇与挑战 / Digital Twin AI: Opportunities and Challenges from Large Language Models to World Models
这篇论文提出了一个统一的四阶段框架,系统阐述了人工智能如何赋能数字孪生,使其从被动模拟工具转变为能够自主推理、预测和管理的智能认知系统,并探讨了其在多个领域的应用与挑战。
SWE-Lego:探索监督微调在软件问题解决任务中的性能极限 / SWE-Lego: Pushing the Limits of Supervised Fine-tuning for Software Issue Resolving
这篇论文提出了一个名为SWE-Lego的监督微调方案,通过构建高质量数据集和改进训练流程,证明了仅用轻量化的监督微调方法就能在软件工程问题解决任务上达到顶尖性能,并可通过测试时扩展进一步提升效果。
请先 登录 后再提交论文