arXiv最新AI论文速览速学

🔍

llm ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 246 最新: scicode-lint: Detecting Methodology Bugs in Scientific Python Code with LLM-Generated Patterns 03-19

arXiv ID: 2602.20117

arXiv 提交日期: 2026-02-23

llm model training agents reinforcement learning synthetic environments reasoning models verifier supervision task diversity

ReSyn：为推理模型自主扩展合成环境 / ReSyn: Autonomously Scaling Synthetic Environments for Reasoning Models

1️⃣ 一句话总结

这篇论文提出了一个名为ReSyn的自动化系统，它能大规模生成多样化的推理任务环境，并利用这些环境来训练语言模型，显著提升了模型在数学和逻辑推理等复杂任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19961

arXiv 提交日期: 2026-02-23

multi-modal natural language processing llm visual document retrieval multimodal llm retrieval-augmented generation survey document intelligence

解锁多模态文档智能：从当前成就到视觉文档检索的未来前沿 / Unlocking Multimodal Document Intelligence: From Current Triumphs to Future Frontiers of Visual Document Retrieval

1️⃣ 一句话总结

这篇论文首次全面综述了视觉文档检索领域，系统梳理了其方法演进、当前挑战，并展望了未来发展方向，为多模态文档智能研究提供了清晰的路线图。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19626

arXiv 提交日期: 2026-02-23

llm systems model training lossless compression neural compression arithmetic coding transformer language model ensemble modeling

Nacrith：通过集成上下文建模和高精度CDF编码实现神经无损压缩 / Nacrith: Neural Lossless Compression via Ensemble Context Modeling and High-Precision CDF Coding

1️⃣ 一句话总结

这篇论文提出了一个名为Nacrith的高效无损压缩系统，它通过结合一个大型语言模型、多个轻量级预测器以及多项创新技术，在文本和二进制文件压缩上取得了比传统方法更好的压缩率，同时还能在普通消费级显卡上快速运行。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19491

arXiv 提交日期: 2026-02-23

robotics agents llm social robotics anthropomorphic robot low-cost platform llm integration human-robot interaction

Botson：一个用于社交机器人研究的易获取且低成本平台 / Botson: An Accessible and Low-Cost Platform for Social Robotics Research

1️⃣ 一句话总结

这篇论文介绍了一个名为Botson的低成本、易获取的社交机器人平台，它通过结合人形外观和大语言模型，旨在解决人工智能因缺乏非语言社交线索而难以在人际交互中建立信任的问题，为相关研究提供了便利工具。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19548

arXiv 提交日期: 2026-02-23

llm data natural language processing html-to-text extraction pretraining data web content data preprocessing benchmark evaluation

超越单一提取器：重新思考用于大语言模型预训练的HTML到文本提取方法 / Beyond a Single Extractor: Re-thinking HTML-to-Text Extraction for LLM Pretraining

1️⃣ 一句话总结

这篇论文研究发现，在构建大语言模型预训练数据集时，对所有网页使用单一的文本提取方法会浪费大量有用内容，而结合多种提取器能显著增加数据量并提升模型在表格、代码等结构化任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20091

arXiv 提交日期: 2026-02-23

llm natural language processing model evaluation retrieval-augmented generation internal representations context relevance representation analysis question answering

检索到的上下文如何塑造RAG中的内部表征 / How Retrieved Context Shapes Internal Representations in RAG

1️⃣ 一句话总结

这篇论文通过分析大语言模型在处理不同相关性的检索文档时内部表征的变化，揭示了检索增强生成（RAG）系统内部如何整合信息，从而解释其输出行为并为系统设计提供新见解。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20055

arXiv 提交日期: 2026-02-23

robotics agents llm interactive navigation constraint-based planning scene graph reasoning active perception manipulation

移动还是不移动：基于约束的规划实现交互式导航的零样本泛化 / To Move or Not to Move: Constraint-based Planning Enables Zero-Shot Generalization for Interactive Navigation

1️⃣ 一句话总结

这篇论文提出了一种让机器人能够主动移动障碍物来开辟新路径的智能导航方法，通过结合大语言模型的推理和主动感知能力，使机器人能在复杂、杂乱的环境中完成一系列物品摆放任务，并在模拟和真实硬件中验证了其有效性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19844

arXiv 提交日期: 2026-02-23

llm systems model evaluation security monitoring threat detection reliability incident response system safety

基于大语言模型的应用需要系统级的威胁监控 / LLM-enabled Applications Require System-Level Threat Monitoring

1️⃣ 一句话总结

这篇论文认为，由于大语言模型行为的不确定性和难以验证性，基于大模型的应用面临新的安全风险，因此必须建立系统级的威胁监控机制，将其作为可靠部署的前提，而不是仅仅依赖测试或防护栏式的防御。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20132

arXiv 提交日期: 2026-02-23

llm reinforcement learning model training advantage distribution reasoning policy optimization diversity distribution matching

LAD：用于推理的优势分布学习 / LAD: Learning Advantage Distribution for Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为LAD的新方法，通过让AI模型学习并匹配‘优势分布’，而不是单纯追求最高奖励，来解决当前大模型在数学和代码推理中容易陷入单一思维、缺乏多样性的问题，从而在提升准确率的同时，也增加了答案的多样性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20092

arXiv 提交日期: 2026-02-23

llm model training model evaluation data-efficient pretraining multilingual cognitively plausible weak model evaluation training efficiency

BabyLM 四岁了：2026年 BabyLM 研讨会征稿启事 / BabyLM Turns 4: Call for Papers for the 2026 BabyLM Workshop

1️⃣ 一句话总结

这篇论文是一份征稿启事，旨在通过举办第四届 BabyLM 竞赛和研讨会，鼓励研究者在数据高效预训练、多语言模型以及认知合理性等方向进行探索，以弥合认知建模与语言建模之间的界限。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.20117

1️⃣ 一句话总结

arXiv ID: 2602.19961

1️⃣ 一句话总结

arXiv ID: 2602.19626

1️⃣ 一句话总结

arXiv ID: 2602.19491

1️⃣ 一句话总结

arXiv ID: 2602.19548

1️⃣ 一句话总结

arXiv ID: 2602.20091

1️⃣ 一句话总结

arXiv ID: 2602.20055

1️⃣ 一句话总结

arXiv ID: 2602.19844

1️⃣ 一句话总结

arXiv ID: 2602.20132

1️⃣ 一句话总结

arXiv ID: 2602.20092

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.20117 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19961 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19626 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19491 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19548 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20091 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20055 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19844 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20132 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20092 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.20117

arXiv ID: 2602.19961

arXiv ID: 2602.19626

arXiv ID: 2602.19491

arXiv ID: 2602.19548

arXiv ID: 2602.20091

arXiv ID: 2602.20055

arXiv ID: 2602.19844

arXiv ID: 2602.20132

arXiv ID: 2602.20092