arXiv最新AI论文速览速学

🔍

标签: #llm ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 43 72小时内新更新论文 72h更新 120 最新: Tacit Knowledge Management with Generative AI: Proposal of the GenAI SECI Model 03-24

arXiv ID: 2602.08819

arXiv 提交日期: 2026-02-09

llm model training reinforcement learning reward modeling bayesian inference preference learning test-time adaptation multi-objective alignment

用于测试时可引导奖励模型的贝叶斯偏好学习 / Bayesian Preference Learning for Test-Time Steerable Reward Models

1️⃣ 一句话总结

这篇论文提出了一种名为ICRM的新方法，它能让AI在训练后根据用户给出的新偏好示例动态调整其奖励判断，从而更灵活地适应多样化的任务需求，比如同时兼顾安全性和有用性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08668

arXiv 提交日期: 2026-02-09

systems natural language processing llm retrieval-augmented generation security knowledge graphs data leakage multi-hop reasoning

混合检索增强生成中的检索枢纽攻击：衡量与缓解从向量种子到图扩展的放大泄漏风险 / Retrieval Pivot Attacks in Hybrid RAG: Measuring and Mitigating Amplified Leakage from Vector Seeds to Graph Expansion

1️⃣ 一句话总结

这篇论文发现，将向量搜索和知识图谱结合使用的混合检索增强生成系统存在一种新的安全漏洞——通过向量检索到的普通信息片段，可以像‘枢纽’一样，顺着知识图谱中的实体链接，意外地访问到其他用户的敏感数据，而作者提出的简单解决方案（在图扩展边界处重新进行权限检查）就能有效堵住这个漏洞。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08019

arXiv 提交日期: 2026-02-08

llm model training systems mixture of experts sparse computation routing networks decentralized architecture survey

稀疏专家混合的兴起：从算法基础到去中心化架构及垂直领域应用的综述 / The Rise of Sparse Mixture-of-Experts:A Survey from Algorithmic Foundations to Decentralized Architectures and Vertical Domain Applications

1️⃣ 一句话总结

这篇综述文章系统梳理了稀疏专家混合模型的发展，从核心算法原理、去中心化架构拓展到垂直领域应用，旨在为研究者和从业者提供该领域最全面的技术概览与未来方向指引。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07954

arXiv 提交日期: 2026-02-08

llm natural language processing model evaluation content moderation safety classifier polish language text classification efficiency

Bielik Guard：用于大语言模型内容审核的高效波兰语安全分类器 / Bielik Guard: Efficient Polish Language Safety Classifiers for LLM Content Moderation

1️⃣ 一句话总结

这篇论文提出了一个名为Bielik Guard的高效波兰语内容安全分类器系列，包含一大一小两个模型，它们能准确识别有害内容并优先提供恰当回应而非简单屏蔽，尤其在小模型上实现了高精度和低误报率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07958

arXiv 提交日期: 2026-02-08

llm systems model evaluation llm offloading uncertainty estimation edge computing latency optimization token-level inference

基于词元级不确定性的LLM卸载中的精度-延迟权衡 / Accuracy-Delay Trade-Off in LLM Offloading via Token-Level Uncertainty

1️⃣ 一句话总结

这篇论文提出了一种基于词元级不确定性的智能卸载框架，通过动态选择在本地还是边缘服务器上执行大语言模型推理，在保证精度的同时有效降低了多用户环境下的延迟。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07892

arXiv 提交日期: 2026-02-08

llm model training machine learning safety alignment continual learning orthogonal gradient projection alignment tax forgetting mitigation

将安全对齐视为持续学习：通过正交梯度投影减轻对齐代价 / Safety Alignment as Continual Learning: Mitigating the Alignment Tax via Orthogonal Gradient Projection

1️⃣ 一句话总结

这篇论文提出了一种名为OGPSA的轻量级方法，通过将安全更新限制在模型通用能力的正交方向上，有效解决了大语言模型在安全对齐过程中会损失原有通用能力（如推理和编程）的普遍问题，从而在提升安全性的同时更好地保持了模型的整体性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07833

arXiv 提交日期: 2026-02-08

multi-modal llm model evaluation faithfulness chain-of-thought benchmark visual reasoning interpretability

SPD-Faith Bench：诊断与提升多模态大语言模型思维链推理的忠实性 / SPD-Faith Bench: Diagnosing and Improving Faithfulness in Chain-of-Thought for Multimodal Large Language Models

1️⃣ 一句话总结

这篇论文提出了一个名为SPD-Faith Bench的诊断基准，用于发现多模态大模型在思维链推理中存在的‘感知盲区’和‘感知-推理脱节’两大不忠实问题，并通过一种无需训练的可视化证据校准框架SAGE来提升推理的可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07848

arXiv 提交日期: 2026-02-08

multi-agents llm model training code generation reinforcement learning multi-agent collaboration tree search scaling laws

MARTI-MARS²：通过强化学习实现代码生成的多智能体自我搜索扩展 / MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Reinforcement Learning for Code Generation

1️⃣ 一句话总结

这篇论文提出了一种名为MARTI-MARS²的新框架，它通过强化学习让多个AI智能体像团队一样协作、互相学习和纠正错误，从而显著提升了复杂代码生成任务的性能，并发现智能体之间的策略多样性是提升整体能力的关键。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07773

arXiv 提交日期: 2026-02-08

agents llm model evaluation search agents reasoning evaluation step-level rating rejection sampling benchmark improvement

SRR-Judge：通过步骤级评分与精炼增强搜索智能体的搜索集成推理能力 / SRR-Judge: Step-Level Rating and Refinement for Enhancing Search-Integrated Reasoning in Search Agents

1️⃣ 一句话总结

这篇论文提出了一个名为SRR-Judge的框架，它通过评估和优化搜索智能体在推理过程中的每一个步骤，而不是只看最终结果，从而显著提升了智能体在复杂问题解答中的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07909

arXiv 提交日期: 2026-02-08

llm model evaluation benchmark efficient evaluation sparse optimization anchor selection gradient descent performance estimation

SparseEval：通过稀疏优化高效评估大语言模型 / SparseEval: Efficient Evaluation of Large Language Models by Sparse Optimization

1️⃣ 一句话总结

这篇论文提出了一种名为SparseEval的新方法，通过将大语言模型评估问题转化为一个稀疏优化问题，并利用梯度下降和迭代策略来智能选取少量代表性测试样本，从而在保证评估准确性的同时，大幅降低了评估所需的计算成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.08819

1️⃣ 一句话总结

arXiv ID: 2602.08668

1️⃣ 一句话总结

arXiv ID: 2602.08019

1️⃣ 一句话总结

arXiv ID: 2602.07954

1️⃣ 一句话总结

arXiv ID: 2602.07958

1️⃣ 一句话总结

arXiv ID: 2602.07892

1️⃣ 一句话总结

arXiv ID: 2602.07833

1️⃣ 一句话总结

arXiv ID: 2602.07848

1️⃣ 一句话总结

arXiv ID: 2602.07773

1️⃣ 一句话总结

arXiv ID: 2602.07909

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.08819 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08668 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08019 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07954 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07958 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07892 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07833 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07848 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07773 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07909 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.08819

arXiv ID: 2602.08668

arXiv ID: 2602.08019

arXiv ID: 2602.07954

arXiv ID: 2602.07958

arXiv ID: 2602.07892

arXiv ID: 2602.07833

arXiv ID: 2602.07848

arXiv ID: 2602.07773

arXiv ID: 2602.07909