arXiv最新AI论文速览速学

🔍

标签: #llm ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 96 72小时内新更新论文 72h更新 150 最新: Sentipolis: Emotion-Aware Agents for Social Simulations 01-31

arXiv ID: 2511.23404

arXiv 提交日期: 2025-11-28

llm model training systems edge deployment architecture search knowledge distillation multimodal models efficient inference

LFM2技术报告 / LFM2 Technical Report

1️⃣ 一句话总结

这篇论文提出了一个名为LFM2的系列模型，它专门为在手机等边缘设备上高效运行而设计，通过创新的架构和训练方法，在保持强大任务处理能力的同时，实现了比同类模型更快的推理速度和更低的内存占用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.23319

arXiv 提交日期: 2025-11-28

llm model training natural language processing long context sparse attention memory length generalization moe

每个词元都重要：在大型语言模型中实现1600万超长上下文的泛化 / Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为‘分层稀疏注意力’的新方法，并将其集成到模型中，成功让一个80亿参数的AI模型能够高效处理和记住长达1600万个词的超长文本信息，在多项测试中表现出色。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.22891

arXiv 提交日期: 2025-11-28

llm model training theory reasoning efficiency language of thought compressed reasoning reinforcement learning latency reduction

ORION：教导语言模型以思维语言进行高效推理 / ORION: Teaching Language Models to Reason Efficiently in the Language of Thought

1️⃣ 一句话总结

这篇论文提出了一个名为ORION的新框架，它通过训练模型使用一种类似人类‘思维语言’的压缩、结构化符号进行推理，从而在保持高准确率的同时，大幅减少了计算所需的步骤和成本，实现了更高效、更快速的AI推理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.03073

arXiv 提交日期: 2025-11-27

llm model training data open source models model ecosystem market concentration model downloads data transparency

开放智能的经济学：追踪模型生态系统中的权力与参与 / Economies of Open Intelligence: Tracing Power & Participation in the Model Ecosystem

1️⃣ 一句话总结

这篇论文通过分析Hugging Face平台超过85万个AI模型的下载数据和元数据，揭示了开放模型经济中权力格局的重大转变：美国科技巨头的统治地位正被独立开发者、社区组织以及以DeepSeek和Qwen为代表的中国产业力量所削弱，同时模型规模、多模态能力等技术特性快速演进，但数据透明度却在下降。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.22570

arXiv 提交日期: 2025-11-27

llm model training theory mathematical reasoning theorem proving self-verification reinforcement learning proof generation

DeepSeekMath-V2：迈向可自我验证的数学推理 / DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为DeepSeekMath-V2的新模型，它通过让AI自己检查和验证推理过程来解决数学问题，而不是只追求最终答案正确，从而在需要严格逻辑推导的数学竞赛中取得了顶尖成绩。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.22176

arXiv 提交日期: 2025-11-27

llm natural language processing model evaluation chain-of-thought reasoning efficiency structured prompting inference latency training-free optimization

聚焦思维链：通过结构化输入信息实现高效大语言模型推理 / Focused Chain-of-Thought: Efficient LLM Reasoning via Structured Input Information

1️⃣ 一句话总结

这篇论文提出了一种无需训练、基于输入信息结构化的‘聚焦思维链’方法，它能将问题中的关键信息提取并组织成简洁的上下文，从而引导大语言模型进行更专注、更高效的推理，在保持准确性的同时大幅减少生成的文本量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.22173

arXiv 提交日期: 2025-11-27

llm model evaluation benchmark refinement capability self-correction evaluation framework feedback reasoning models

RefineBench：通过清单评估语言模型的精炼能力 / RefineBench: Evaluating Refinement Capability of Language Models via Checklists

1️⃣ 一句话总结

这篇论文提出了一个名为RefineBench的新基准测试，发现当前最先进的语言模型在没有外部指导的情况下，很难有效地自我修正错误答案，但在获得明确反馈后却能大幅改进，这揭示了模型自我精炼能力的局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.22146

arXiv 提交日期: 2025-11-27

llm model training natural language processing diffusion language models causal reasoning attention mechanism concept-guided learning reasoning tasks

C$^2$DLM：因果概念引导的扩散大语言模型 / C$^2$DLM: Causal Concept-Guided Diffusion Large Language Models

1️⃣ 一句话总结

这篇论文提出了一种新的扩散大语言模型，通过引入概念级的因果图来指导模型学习概念间的因果关系，从而显著提升了模型的推理能力和训练效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.22055

arXiv 提交日期: 2025-11-27

medical multi-modal llm dental imaging multimodal llm clinical reasoning benchmark chain-of-thought

OralGPT-Omni：一个多功能牙科多模态大语言模型 / OralGPT-Omni: A Versatile Dental Multimodal Large Language Model

1️⃣ 一句话总结

这篇论文提出了首个专门用于牙科领域的多模态大语言模型OralGPT-Omni，它通过模仿牙医诊断思维的数据集和训练方法，能够准确理解和分析多种牙科影像，并在权威评测中表现优异，推动了牙科人工智能的发展。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.21692

arXiv 提交日期: 2025-11-26

llm model training model evaluation generalization difficulty levels item response theory data curation evaluation

重新审视跨难度级别的泛化：这并不简单 / Revisiting Generalization Across Difficulty Levels: It's Not So Easy

1️⃣ 一句话总结

这项研究发现，大型语言模型在跨越不同难度任务时的泛化能力有限，无论是用简单还是困难的数据训练，都无法在所有难度级别上取得一致性的提升，强调了训练和评估数据中难度多样性的重要性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2511.23404

1️⃣ 一句话总结

arXiv ID: 2511.23319

1️⃣ 一句话总结

arXiv ID: 2511.22891

1️⃣ 一句话总结

arXiv ID: 2512.03073

1️⃣ 一句话总结

arXiv ID: 2511.22570

1️⃣ 一句话总结

arXiv ID: 2511.22176

1️⃣ 一句话总结

arXiv ID: 2511.22173

1️⃣ 一句话总结

arXiv ID: 2511.22146

1️⃣ 一句话总结

arXiv ID: 2511.22055

1️⃣ 一句话总结

arXiv ID: 2511.21692

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2511.23404 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.23319 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.22891 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.03073 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.22570 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.22176 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.22173 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.22146 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.22055 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.21692 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2511.23404

arXiv ID: 2511.23319

arXiv ID: 2511.22891

arXiv ID: 2512.03073

arXiv ID: 2511.22570

arXiv ID: 2511.22176

arXiv ID: 2511.22173

arXiv ID: 2511.22146

arXiv ID: 2511.22055

arXiv ID: 2511.21692