arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 167 最新: MovieTeller: Tool-augmented Movie Synopsis with ID Consistent Progressive Abstraction 02-27

arXiv ID: 2602.08019

arXiv 提交日期: 2026-02-08

llm model training systems mixture of experts sparse computation routing networks decentralized architecture survey

稀疏专家混合的兴起：从算法基础到去中心化架构及垂直领域应用的综述 / The Rise of Sparse Mixture-of-Experts:A Survey from Algorithmic Foundations to Decentralized Architectures and Vertical Domain Applications

1️⃣ 一句话总结

这篇综述文章系统梳理了稀疏专家混合模型的发展，从核心算法原理、去中心化架构拓展到垂直领域应用，旨在为研究者和从业者提供该领域最全面的技术概览与未来方向指引。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07954

arXiv 提交日期: 2026-02-08

llm natural language processing model evaluation content moderation safety classifier polish language text classification efficiency

Bielik Guard：用于大语言模型内容审核的高效波兰语安全分类器 / Bielik Guard: Efficient Polish Language Safety Classifiers for LLM Content Moderation

1️⃣ 一句话总结

这篇论文提出了一个名为Bielik Guard的高效波兰语内容安全分类器系列，包含一大一小两个模型，它们能准确识别有害内容并优先提供恰当回应而非简单屏蔽，尤其在小模型上实现了高精度和低误报率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07958

arXiv 提交日期: 2026-02-08

llm systems model evaluation llm offloading uncertainty estimation edge computing latency optimization token-level inference

基于词元级不确定性的LLM卸载中的精度-延迟权衡 / Accuracy-Delay Trade-Off in LLM Offloading via Token-Level Uncertainty

1️⃣ 一句话总结

这篇论文提出了一种基于词元级不确定性的智能卸载框架，通过动态选择在本地还是边缘服务器上执行大语言模型推理，在保证精度的同时有效降低了多用户环境下的延迟。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07872

arXiv 提交日期: 2026-02-08

medical computer vision multi-modal medical image retrieval radiology reports contrastive learning fracture diagnosis pediatric imaging

WristMIR：基于放射学报告驱动学习、从粗到细的区域感知儿科腕部X光片检索 / WristMIR: Coarse-to-Fine Region-Aware Retrieval of Pediatric Wrist Radiographs with Radiology Report-Driven Learning

1️⃣ 一句话总结

这篇论文提出了一个名为WristMIR的智能系统，它能自动分析儿科腕部X光片和对应的放射科医生报告，先快速筛选出可能相似的病例，再针对特定骨骼区域进行精细比对，从而更准确地帮助医生找到具有相似骨折特征的参考影像，辅助诊断。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08024

arXiv 提交日期: 2026-02-08

video model training natural language processing video llms token merging inference acceleration spatiotemporal compression efficiency

FlashVID：一种基于无训练树状时空令牌合并的高效视频大语言模型 / FlashVID: Efficient Video Large Language Models via Training-free Tree-based Spatiotemporal Token Merging

1️⃣ 一句话总结

这篇论文提出了一种名为FlashVID的无训练加速框架，它通过智能合并视频中相似或冗余的视觉信息块，让视频大模型在仅处理10%数据量的情况下，就能保持99%以上的理解性能，从而大幅提升了处理长视频的效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07892

arXiv 提交日期: 2026-02-08

llm model training machine learning safety alignment continual learning orthogonal gradient projection alignment tax forgetting mitigation

将安全对齐视为持续学习：通过正交梯度投影减轻对齐代价 / Safety Alignment as Continual Learning: Mitigating the Alignment Tax via Orthogonal Gradient Projection

1️⃣ 一句话总结

这篇论文提出了一种名为OGPSA的轻量级方法，通过将安全更新限制在模型通用能力的正交方向上，有效解决了大语言模型在安全对齐过程中会损失原有通用能力（如推理和编程）的普遍问题，从而在提升安全性的同时更好地保持了模型的整体性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07833

arXiv 提交日期: 2026-02-08

multi-modal llm model evaluation faithfulness chain-of-thought benchmark visual reasoning interpretability

SPD-Faith Bench：诊断与提升多模态大语言模型思维链推理的忠实性 / SPD-Faith Bench: Diagnosing and Improving Faithfulness in Chain-of-Thought for Multimodal Large Language Models

1️⃣ 一句话总结

这篇论文提出了一个名为SPD-Faith Bench的诊断基准，用于发现多模态大模型在思维链推理中存在的‘感知盲区’和‘感知-推理脱节’两大不忠实问题，并通过一种无需训练的可视化证据校准框架SAGE来提升推理的可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08131

arXiv 提交日期: 2026-02-08

computer vision data benchmark agricultural mapping field boundary extraction satellite imagery segmentation crop classification

世界农田：一套用于提取农田边界的实用指南与工具集 / Fields of The World: A Field Guide for Extracting Agricultural Field Boundaries

1️⃣ 一句话总结

这篇论文介绍了一个名为‘世界农田’的生态系统，它提供了一个包含全球160万块农田样本的数据集、预训练模型和便捷工具，帮助研究者和从业者高效、准确地从卫星图像中识别农田边界并进行作物分类，从而支持农业监测与决策。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08040

arXiv 提交日期: 2026-02-08

model training machine learning systems continual learning stability-plasticity tradeoff weight reinitialization optimization deep neural networks

FIRE：用于平衡稳定性-可塑性权衡的Frobenius等距重初始化方法 / FIRE: Frobenius-Isometry Reinitialization for Balancing the Stability-Plasticity Tradeoff

1️⃣ 一句话总结

这篇论文提出了一种名为FIRE的新方法，它通过一个数学优化问题来智能地调整神经网络权重，从而在持续学习任务中巧妙地平衡了‘记住旧知识’和‘学习新任务’之间的矛盾，并在图像、语言和强化学习等多个领域取得了更好的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08104

arXiv 提交日期: 2026-02-08

multi-agents reinforcement learning model evaluation failure analysis interpretability gradient-based diagnostics multi-agent systems safety-critical

多智能体强化学习系统中的可解释故障分析 / Interpretable Failure Analysis in Multi-Agent Reinforcement Learning Systems

1️⃣ 一句话总结

这篇论文提出了一种基于梯度的两阶段框架，用于在多智能体强化学习系统中可解释地检测、定位并追踪故障的初始源头及其在智能体间的传播路径，以提高关键安全应用中的系统诊断能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.08019

1️⃣ 一句话总结

arXiv ID: 2602.07954

1️⃣ 一句话总结

arXiv ID: 2602.07958

1️⃣ 一句话总结

arXiv ID: 2602.07872

1️⃣ 一句话总结

arXiv ID: 2602.08024

1️⃣ 一句话总结

arXiv ID: 2602.07892

1️⃣ 一句话总结

arXiv ID: 2602.07833

1️⃣ 一句话总结

arXiv ID: 2602.08131

1️⃣ 一句话总结

arXiv ID: 2602.08040

1️⃣ 一句话总结

arXiv ID: 2602.08104

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.08019 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07954 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07958 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07872 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08024 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07892 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07833 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08131 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08040 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08104 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.08019

arXiv ID: 2602.07954

arXiv ID: 2602.07958

arXiv ID: 2602.07872

arXiv ID: 2602.08024

arXiv ID: 2602.07892

arXiv ID: 2602.07833

arXiv ID: 2602.08131

arXiv ID: 2602.08040

arXiv ID: 2602.08104