arXiv最新AI论文速览速学

🔍

natural language processing ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 170 72小时内新更新论文 72h更新 265 最新: Can LLMs Model Incorrect Student Reasoning? A Case Study on Distractor Generation 03-18

arXiv ID: 2603.05256

arXiv 提交日期: 2026-03-05

multi-modal model training natural language processing visual question answering knowledge-based reasoning curriculum learning reinforcement learning data generation

Wiki-R1：通过数据和采样课程激励基于知识的视觉问答中的多模态推理 / Wiki-R1: Incentivizing Multimodal Reasoning for Knowledge-based VQA via Data and Sampling Curriculum

1️⃣ 一句话总结

这篇论文提出了一种名为Wiki-R1的课程学习框架，通过生成可控难度的训练数据和智能采样策略，帮助多模态大语言模型更好地结合外部知识来回答图片相关的问题，从而在两项视觉问答基准测试上取得了新的最佳性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05057

arXiv 提交日期: 2026-03-05

natural language processing llm toxic span detection sequence labeling multilingual transformers conditional random fields urdu nlp

MUTEX：利用多语言Transformer与条件随机场增强乌尔都语有毒文本片段检测 / MUTEX: Leveraging Multilingual Transformers and Conditional Random Fields for Enhanced Urdu Toxic Span Detection

1️⃣ 一句话总结

这项研究提出了一个结合多语言Transformer和条件随机场的新模型MUTEX，首次为乌尔都语建立了能精准识别句子中有毒词汇片段（而非仅判断整句）的监督基线系统，有效应对了该语言因形态复杂、语码混合等带来的检测挑战。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05299

arXiv 提交日期: 2026-03-05

audio natural language processing model training speech language model self-supervised learning knowledge distillation autoregressive generation speech representation

WavSLM：通过WavLM蒸馏实现单流语音语言建模 / WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

1️⃣ 一句话总结

这篇论文提出了一种名为WavSLM的新型语音语言模型，它通过将自监督语音表征蒸馏并量化为单一码本，实现了无需文本监督、仅用单一数据流就能同时建模语音的语义和声学信息，从而简化了模型结构并支持流式推理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05345

arXiv 提交日期: 2026-03-05

natural language processing data systems text simplification multilingual corpus easy-to-read human annotation democratic participation

一个支持民主参与过程的多语言人工标注原始文本与易读文本语料库 / A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

1️⃣ 一句话总结

这篇论文为西班牙语、加泰罗尼亚语和意大利语创建了一个高质量的人工简化文本语料库，旨在通过提供易读材料来支持民主参与，并填补这些语言在自动文本简化研究领域的数据空白。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05262

arXiv 提交日期: 2026-03-05

natural language processing data llm dataset job advertisements vietnamese nlp benchmark labour market analysis

VietJobs：一个越南语招聘广告数据集 / VietJobs: A Vietnamese Job Advertisement Dataset

1️⃣ 一句话总结

这篇论文发布了一个名为VietJobs的首个大规模、公开的越南语招聘广告数据集，包含超过4.8万条涵盖越南全国的招聘信息，并利用该数据集测试了大型语言模型在职位分类和薪资预测任务上的表现，为越南自然语言处理和劳动力市场分析研究提供了重要基础。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05314

arXiv 提交日期: 2026-03-05

natural language processing model training data punctuation restoration persian nlp sequence labeling low-resource languages bert fine-tuning

PersianPunc：一个用于波斯语标点恢复的大规模数据集及基于BERT的方法 / PersianPunc: A Large-Scale Dataset and BERT-Based Approach for Persian Punctuation Restoration

1️⃣ 一句话总结

这篇论文创建了一个大规模高质量的波斯语标点恢复数据集，并提出了一个高效的基于BERT的模型，该模型在性能上优于大语言模型，解决了后者在标点恢复中容易过度修改和计算成本高的问题，为波斯语等资源匮乏语言的处理提供了实用方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.04741

arXiv 提交日期: 2026-03-05

natural language processing model training data numerical reasoning embedding transformer semantic encoding structured data

CONE：保留单位和变量语义的复杂数值数据嵌入方法 / CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics

1️⃣ 一句话总结

本文提出了一种名为CONE的新型预训练模型，它通过创新的复合嵌入算法，将数字、范围和概率分布与其单位、属性名一起编码，从而显著提升了AI模型对复杂数值数据的理解和推理能力，在多个领域的基准测试中超越了现有最佳模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05121

arXiv 提交日期: 2026-03-05

llm model evaluation natural language processing speech llm layer pruning model redundancy speech translation parameter efficiency

测量语音大语言模型中解码器层的冗余性 / Measuring the Redundancy of Decoder Layers in SpeechLLMs

1️⃣ 一句话总结

这篇论文研究发现，用于处理语音任务的大语言模型（SpeechLLM）的解码器部分存在大量冗余，通过剪枝移除多达40%的层后模型性能依然良好，并且这种冗余模式在不同任务和语言中具有一致性，为构建更高效的轻量级多任务语音模型提供了可能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.04818

arXiv 提交日期: 2026-03-05

llm natural language processing multi-modal temporal graph networks explainable ai port congestion prediction llm-grounded reasoning graph attention networks

基于时序图注意力网络与LLM的港口拥堵预测可解释性框架 / LLM-Grounded Explainability for Port Congestion Prediction via Temporal Graph Attention Networks

1️⃣ 一句话总结

这篇论文提出了一个名为AIS-TGNN的框架，它结合了时序图注意力网络和大语言模型，不仅能准确预测港口拥堵，还能利用模型内部证据生成可靠的自然语言解释，为海事监控和供应链风险管理提供了可审计的AI解决方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.04276

arXiv 提交日期: 2026-03-04

llm natural language processing theory causal discovery knowledge elicitation causal graphs event extraction causal reasoning

从大语言模型中提取因果关系 / Causality Elicitation from Large Language Models

1️⃣ 一句话总结

这篇论文提出了一种从大语言模型中提取和构建潜在因果关系假设的自动化流程，帮助人们可视化和检验模型内部隐含的因果知识。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.05256

1️⃣ 一句话总结

arXiv ID: 2603.05057

1️⃣ 一句话总结

arXiv ID: 2603.05299

1️⃣ 一句话总结

arXiv ID: 2603.05345

1️⃣ 一句话总结

arXiv ID: 2603.05262

1️⃣ 一句话总结

arXiv ID: 2603.05314

1️⃣ 一句话总结

arXiv ID: 2603.04741

1️⃣ 一句话总结

arXiv ID: 2603.05121

1️⃣ 一句话总结

arXiv ID: 2603.04818

1️⃣ 一句话总结

arXiv ID: 2603.04276

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.05256 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05057 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05299 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05345 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05262 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05314 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.04741 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05121 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.04818 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.04276 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.05256

arXiv ID: 2603.05057

arXiv ID: 2603.05299

arXiv ID: 2603.05345

arXiv ID: 2603.05262

arXiv ID: 2603.05314

arXiv ID: 2603.04741

arXiv ID: 2603.05121

arXiv ID: 2603.04818

arXiv ID: 2603.04276