arXiv最新AI论文速览速学

🔍

natural language processing ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 170 72小时内新更新论文 72h更新 265 最新: Can LLMs Model Incorrect Student Reasoning? A Case Study on Distractor Generation 03-18

arXiv ID: 2603.08358

arXiv 提交日期: 2026-03-09

llm natural language processing model evaluation pragmatics presupposition natural language inference diagnostic dataset explainability

语言模型知道Theo有妻子吗？探究附带条件问题 / Do Language Models Know Theo Has a Wife? Investigating the Proviso Problem

1️⃣ 一句话总结

这篇论文通过将语用学中一个关于条件句预设的未解难题转化为自然语言推理任务，并构建诊断数据集来测试主流语言模型，发现这些模型虽然总体上能做出与人类相似的判断，但其依据是浅层的模式匹配而非深层的语义或语用推理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.07868

arXiv 提交日期: 2026-03-09

multi-modal model evaluation natural language processing vision-language models visual question answering domain-specific evaluation informativeness metric hospitality ai

Hospitality-VQA：面向决策的视觉语言模型信息性评估 / Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

1️⃣ 一句话总结

这篇论文提出了一个针对酒店和设施图像的视觉问答新框架，通过定义“信息性”来衡量图像和问题对用户决策的帮助程度，并构建了一个专门的评测数据集，发现当前先进的视觉语言模型需要经过特定领域微调才能有效利用关键视觉信息来支持决策。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.07766

arXiv 提交日期: 2026-03-08

llm natural language processing model evaluation sentiment analysis ensemble learning aspect-based regression roberta

QuadAI在SemEval-2026任务3中的工作：结合混合RoBERTa与大语言模型的集成学习方法用于维度方面情感分析 / QuadAI at SemEval-2026 Task 3: Ensemble Learning of Hybrid RoBERTa and LLMs for Dimensional Aspect-Based Sentiment Analysis

1️⃣ 一句话总结

这篇论文提出了一种用于维度方面情感分析的新方法，通过将混合RoBERTa模型与大语言模型的预测结果进行集成学习，有效提升了预测的准确性和稳定性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.07238

arXiv 提交日期: 2026-03-07

audio natural language processing model training self-supervised learning speech models language identification computational phylogenetics acoustic signatures

扩展自监督语音模型揭示深层语言关系：来自太平洋语群的证据 / Scaling Self-Supervised Speech Models Uncovers Deep Linguistic Relationships: Evidence from the Pacific Cluster

1️⃣ 一句话总结

这篇论文发现，当自监督语音模型训练的语言数量从126种大幅扩展到4017种时，模型能够突破表面相似性，捕捉到更深层的语言谱系关系和长期接触历史，例如在太平洋地区识别出一个包含巴布亚语、大洋洲语和澳大利亚原住民语的宏观语群。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.07368

arXiv 提交日期: 2026-03-07

llm natural language processing model evaluation bias mitigation fairness retrieval-augmented generation category theory demographic bias

立场：大型语言模型必须采用基于函子和RAG驱动的偏见缓解方法以实现公平性 / Position: LLMs Must Use Functor-Based and RAG-Driven Bias Mitigation for Fairness

1️⃣ 一句话总结

这篇立场论文主张通过结合范畴论的函子映射和检索增强生成技术，从结构上和动态知识注入两方面系统性地消除大型语言模型中的性别、种族等社会偏见，以实现更公平的模型输出。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.06397

arXiv 提交日期: 2026-03-06

reinforcement learning natural language processing model training retrieval set-valued objectives diffusion models efficiency synthetic data

通过强化学习编译扩散实现高效、属性对齐的扇出检索 / Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion

1️⃣ 一句话总结

这篇论文提出了一种名为R4T的新方法，它先用强化学习训练一个大语言模型来优化检索结果的集合属性（如多样性），然后利用该模型生成训练数据，最终训练一个轻量级的扩散模型来高效地一次性检索出满足复杂属性要求的物品集合，从而在保证质量的同时大幅提升了检索速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05829

arXiv 提交日期: 2026-03-06

llm model evaluation natural language processing test-time adaptation in-context learning many-shot prompting prompt engineering evaluation

通过多样本提示进行测试时适应：优势、局限与陷阱 / Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

1️⃣ 一句话总结

这篇论文通过实验研究发现，在推理时给大语言模型输入大量示例（多样本提示）可以有效提升其在结构化任务上的表现，但这种方法的有效性高度依赖于示例的选择策略，并且对开放式生成任务帮助有限，甚至可能有害。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05728

arXiv 提交日期: 2026-03-05

llm natural language processing systems formal specification linear temporal logic constrained generation symbolic reasoning consistency checking

LTLGuard：利用紧凑语言模型与轻量级符号推理形式化LTL规范 / LTLGuard: Formalizing LTL Specifications with Compact Language Models and Lightweight Symbolic Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为LTLGuard的工具链，它通过将小型语言模型的生成能力与轻量级自动推理工具相结合，有效地将模糊的自然语言需求转化为正确且无冲突的线性时序逻辑（LTL）形式化规范。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05171

arXiv 提交日期: 2026-03-05

natural language processing systems data legal argumentation annotation framework computational law text annotation judicial reasoning

中国司法裁判文书法律论证结构的标注与可视化指南 / Guidelines for the Annotation and Visualization of Legal Argumentation Structures in Chinese Judicial Decisions

1️⃣ 一句话总结

这篇论文提出了一套用于标注和分析中国司法裁判文书中法律论证结构的系统性框架，通过定义不同类型的命题和论证关系，旨在为法律论证挖掘和人工智能辅助法律分析提供可靠的数据基础和方法支持。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.04756

arXiv 提交日期: 2026-03-05

agents systems natural language processing domain-specific agent retrieval-augmented generation simulation environment input file generation tool-enabled workflow

MOOSEnger——一个面向MOOSE仿真生态系统的领域专用AI助手 / MOOSEnger -- a Domain-Specific AI Agent for the MOOSE Ecosystem

1️⃣ 一句话总结

这篇论文介绍了一个名为MOOSEnger的AI助手，它能通过对话理解用户用自然语言描述的需求，自动生成、验证并运行复杂的多物理场仿真代码，将工程师从繁琐且易错的代码编写与调试工作中解放出来，极大地提升了仿真工作的效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.08358

1️⃣ 一句话总结

arXiv ID: 2603.07868

1️⃣ 一句话总结

arXiv ID: 2603.07766

1️⃣ 一句话总结

arXiv ID: 2603.07238

1️⃣ 一句话总结

arXiv ID: 2603.07368

1️⃣ 一句话总结

arXiv ID: 2603.06397

1️⃣ 一句话总结

arXiv ID: 2603.05829

1️⃣ 一句话总结

arXiv ID: 2603.05728

1️⃣ 一句话总结

arXiv ID: 2603.05171

1️⃣ 一句话总结

arXiv ID: 2603.04756

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.08358 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.07868 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.07766 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.07238 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.07368 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.06397 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05829 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05728 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05171 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.04756 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.08358

arXiv ID: 2603.07868

arXiv ID: 2603.07766

arXiv ID: 2603.07238

arXiv ID: 2603.07368

arXiv ID: 2603.06397

arXiv ID: 2603.05829

arXiv ID: 2603.05728

arXiv ID: 2603.05171

arXiv ID: 2603.04756