arXiv最新AI论文速览速学

🔍

标签: #small language models ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: FLANS at SemEval-2026 Task 7: RAG with Open-Sourced Smaller LLMs for Everyday Knowledge Across Diverse Languages and Cultures 03-03

arXiv ID: 2603.01910

arXiv 提交日期: 2026-03-02

llm natural language processing data retrieval augmented generation multilingual evaluation culturally aware knowledge small language models question answering

FLANS在SemEval-2026任务7中的实践：利用开源小型大语言模型与检索增强生成技术处理多语言与跨文化的日常知识问答 / FLANS at SemEval-2026 Task 7: RAG with Open-Sourced Smaller LLMs for Everyday Knowledge Across Diverse Languages and Cultures

1️⃣ 一句话总结

这篇论文介绍了团队在SemEval-2025跨文化日常知识问答任务中，通过构建一个包含文化感知知识的本地知识库，并融合在线搜索，利用开源小型大语言模型结合检索增强生成技术，在英语、西班牙语和中文的简答与选择题上进行了有效尝试，旨在平衡性能、隐私与可持续性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22124

arXiv 提交日期: 2026-02-25

llm agents systems software engineering expert collaboration selective querying agentic reinforcement learning small language models

SWE-Protégé：学习选择性寻求专家协作，解锁小语言模型作为软件工程智能体的潜力 / SWE-Protégé: Learning to Selectively Collaborate With an Expert Unlocks Small Language Models as Software Engineering Agents

1️⃣ 一句话总结

这篇论文提出了一种名为SWE-Protégé的新方法，通过教会一个小型语言模型在修复软件错误时，像学徒一样聪明地选择时机向一个更强大的‘专家’模型求助，从而显著提升了小模型处理复杂软件工程任务的能力，使其性能大幅提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21699

arXiv 提交日期: 2026-01-29

agents model training reinforcement learning multi-hop reasoning resource-constrained agents retrieval credit assignment exploration resampling small language models

大卫能战胜歌利亚吗？论资源受限智能体的多跳推理 / Can David Beat Goliath? On Multi-Hop Reasoning with Resource-Constrained Agents

1️⃣ 一句话总结

这篇论文提出了一种名为DAVID-GRPO的高效强化学习框架，它通过稳定早期学习、优化检索信用分配和改进探索策略，成功让参数规模较小、计算资源有限的AI智能体在复杂的多步推理任务上取得了高精度表现，打破了‘低成本必然低精度’的固有困境。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.07790

arXiv 提交日期: 2026-01-12

llm benchmark systems log analysis severity classification retrieval-augmented generation small language models system monitoring

评估小型语言模型和推理模型在系统日志严重性分类任务上的表现 / Benchmarking Small Language Models and Small Reasoning Language Models on System Log Severity Classification

1️⃣ 一句话总结

这篇论文通过系统日志严重性分类这个任务，来测试多种小型AI模型的实际理解能力和部署效率，发现模型架构、训练目标和能否有效利用外部信息是决定其性能的关键，为实时监控系统的AI选型提供了重要参考。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.18890

arXiv 提交日期: 2025-11-24

llm model training systems small language models latency optimization model architecture efficient attention evolutionary search

Nemotron-Flash：迈向延迟最优的混合小型语言模型 / Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为Nemotron-Flash的新型混合小型语言模型，它通过优化模型深度与宽度的比例、选择高效的运算模块以及改进训练方法，在保证精度的同时，显著降低了模型在实际设备上的运行延迟并提高了处理速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.25364

arXiv 提交日期: 2025-10-29

llm model training model evaluation instruction tuning small language models curriculum learning zero-shot evaluation linguistic generalization

CLASS-IT：面向BabyLMs的对话与讲座对齐小规模指令调优 / CLASS-IT: Conversational and Lecture-Aligned Small-Scale Instruction Tuning for BabyLMs

1️⃣ 一句话总结

这项研究发现，对小规模语言模型进行指令调优能在特定任务上带来小幅但稳定的性能提升，但难以直接迁移到零样本场景，揭示了模型在交互适应与广泛语言泛化之间的权衡。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.21970

arXiv 提交日期: 2025-10-24

llm model training model evaluation small language models e-commerce quantization performance optimization intent recognition

针对电子商务优化小型语言模型的性能权衡 / Performance Trade-offs of Optimizing Small Language Models for E-Commerce

1️⃣ 一句话总结

这篇论文证明通过专门优化的小型语言模型可以在电子商务意图识别任务中达到与大型模型相当的99%准确率，同时显著降低计算成本，但不同硬件上的性能表现存在明显权衡。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.14252

arXiv 提交日期: 2025-10-16

llm natural language processing systems retrieval-augmented generation document memory reasoning small language models text processing

MoM：面向检索增强生成系统的场景感知文档记忆混合框架 / MoM: Mixtures of Scenario-Aware Document Memories for Retrieval-Augmented Generation Systems

1️⃣ 一句话总结

本文提出了一种名为MoM的创新框架，通过模拟人类主动阅读和认知过程，将传统检索增强生成系统的被动文本分块转变为主动构建场景感知的文档记忆，从而提升小语言模型在多领域文档处理中的语义理解和推理能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.01910

1️⃣ 一句话总结

arXiv ID: 2602.22124

1️⃣ 一句话总结

arXiv ID: 2601.21699

1️⃣ 一句话总结

arXiv ID: 2601.07790

1️⃣ 一句话总结

arXiv ID: 2511.18890

1️⃣ 一句话总结

arXiv ID: 2510.25364

1️⃣ 一句话总结

arXiv ID: 2510.21970

1️⃣ 一句话总结

arXiv ID: 2510.14252

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.01910 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22124 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21699 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.07790 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.18890 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.25364 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.21970 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.14252 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.01910

arXiv ID: 2602.22124

arXiv ID: 2601.21699

arXiv ID: 2601.07790

arXiv ID: 2511.18890

arXiv ID: 2510.25364

arXiv ID: 2510.21970

arXiv ID: 2510.14252