arXiv最新AI论文速览速学

🔍

natural language processing ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 170 72小时内新更新论文 72h更新 265 最新: Can LLMs Model Incorrect Student Reasoning? A Case Study on Distractor Generation 03-18

arXiv ID: 2603.04334

arXiv 提交日期: 2026-03-04

llm model evaluation natural language processing text-to-sql verification equivalence checking constraint mining evaluation benchmark

SpotIt+：基于验证和数据库约束的文本到SQL评估工具 / SpotIt+: Verification-based Text-to-SQL Evaluation with Database Constraints

1️⃣ 一句话总结

这篇论文提出了一个名为SpotIt+的开源工具，它通过自动寻找能区分AI生成的SQL查询和标准答案的数据库实例来评估文本转SQL系统，并利用挖掘出的数据库约束来确保找到的差异具有实际意义，从而比传统测试方法更高效、更准确地发现潜在问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02684

arXiv 提交日期: 2026-03-03

natural language processing data model evaluation hate speech detection explainable ai misinformation dataset multidimensional annotation

HateMirage：一个用于解码伪装仇恨与微妙网络暴力的可解释多维数据集 / HateMirage: An Explainable Multi-Dimensional Dataset for Decoding Faux Hate and Subtle Online Abuse

1️⃣ 一句话总结

这篇论文提出了一个名为HateMirage的新数据集，专门用于研究那些隐藏在虚假信息或误导性叙事中的、不易察觉的仇恨言论，并通过一个多维度标注框架来帮助AI模型更好地理解和解释这类有害内容的意图与影响。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02658

arXiv 提交日期: 2026-03-03

multi-modal computer vision natural language processing fashion intelligence vision-language model multi-task learning dataset dialogue system

OmniFashion：通过多任务视觉-语言学习迈向通用时尚智能 / OmniFashion: Towards Generalist Fashion Intelligence via Multi-Task Vision-Language Learning

1️⃣ 一句话总结

这篇论文提出了一个名为OmniFashion的统一视觉-语言框架，它通过构建大规模数据集和创新的对话范式，将检索、推荐、识别等多种时尚任务整合在一起，实现了跨任务的准确理解和推理，为构建通用的、对话驱动的时尚智能系统提供了可行路径。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02547

arXiv 提交日期: 2026-03-03

natural language processing model training machine learning diffusion models language modeling text generation autoregressive decoding continuous embeddings

CoDAR：连续扩散语言模型比你想象的更强大 / CoDAR: Continuous Diffusion Language Models are More Powerful Than You Think

1️⃣ 一句话总结

这篇论文提出了一个名为CoDAR的两阶段新框架，通过让一个自回归解码器智能地将连续扩散模型生成的“去噪”向量转化为词语，解决了连续扩散语言模型性能不佳的关键瓶颈，使其生成文本的质量大幅提升，并能灵活调节生成文本的流畅性与多样性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02760

arXiv 提交日期: 2026-03-03

llm model evaluation natural language processing diffusion language models self-evaluation uncertainty quantification sequence regeneration flexible-length generation

通过序列再生实现扩散语言模型的高效自我评估 / Efficient Self-Evaluation for Diffusion Language Models via Sequence Regeneration

1️⃣ 一句话总结

这篇论文提出了一种名为DiSE的新方法，它能让扩散大语言模型通过计算完整序列的再生概率来评估自身生成内容的质量和可信度，从而更高效地判断答案好坏并灵活控制生成长度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03389

arXiv 提交日期: 2026-03-03

llm natural language processing model evaluation sentence representation pooling methods graph neural networks token graphs parameter-efficient adaptation

迈向使用词元图改进句子表示 / Towards Improved Sentence Representations using Token Graphs

1️⃣ 一句话总结

这篇论文提出了一种名为GLOT的轻量级方法，它通过将句子中的词元构建成图并利用图神经网络进行聚合，从而更有效地从大型语言模型中提取高质量的句子向量表示，该方法在保持高准确率的同时，显著减少了计算开销。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03072

arXiv 提交日期: 2026-03-03

llm model training natural language processing text-to-tikz reinforcement learning dataset construction inverse graphics code generation

TikZilla：利用高质量数据和强化学习扩展文本到TikZ的生成能力 / TikZilla: Scaling Text-to-TikZ with High-Quality Data and Reinforcement Learning

1️⃣ 一句话总结

这篇论文通过构建一个更大、质量更高的数据集，并采用监督微调结合强化学习的两阶段训练方法，开发出名为TikZilla的小型开源模型，使其在根据文字描述生成科学图表代码（TikZ）的任务上，性能超越了GPT-4o，并与更强大的模型相当。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03001

arXiv 提交日期: 2026-03-03

natural language processing model training machine learning transformer mamba efficient training long context masked language modeling

MaBERT：一种用于高效长上下文掩码语言建模的、对填充安全的交错式Transformer-Mamba混合编码器 / MaBERT:A Padding Safe Interleaved Transformer Mamba Hybrid Encoder for Efficient Extended Context Masked Language Modeling

1️⃣ 一句话总结

这篇论文提出了一种名为MaBERT的新型混合编码器，它通过交替使用Transformer层和Mamba层，在保证高效处理长文本的同时，解决了传统模型计算成本高和填充数据污染状态的问题，显著提升了训练和推理速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02865

arXiv 提交日期: 2026-03-03

multi-modal model evaluation natural language processing vision-language models diagram understanding representation probing graph reasoning linear separability

节点早，边晚：探究大型视觉语言模型中的图表表征 / Nodes Are Early, Edges Are Late: Probing Diagram Representations in Large Vision-Language Models

1️⃣ 一句话总结

这篇论文发现，大型视觉语言模型在处理图表时，能很快识别出节点信息，但理解节点间连线（如箭头）所代表的关系却很慢，这解释了为什么这类模型在理解图表逻辑关系时表现不佳。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02854

arXiv 提交日期: 2026-03-03

robotics natural language processing multi-modal language-conditioned navigation continuous flow fields bird's-eye view end-to-end policy trajectory generation

CoFL：用于语言条件导航的连续流场 / CoFL: Continuous Flow Fields for Language-Conditioned Navigation

1️⃣ 一句话总结

这篇论文提出了一个名为CoFL的端到端导航模型，它能够根据鸟瞰图观察和语言指令直接生成一个连续的流场，从而规划出平滑、反应灵敏的机器人运动轨迹，并在模拟和真实世界的实验中取得了优于现有方法的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.04334

1️⃣ 一句话总结

arXiv ID: 2603.02684

1️⃣ 一句话总结

arXiv ID: 2603.02658

1️⃣ 一句话总结

arXiv ID: 2603.02547

1️⃣ 一句话总结

arXiv ID: 2603.02760

1️⃣ 一句话总结

arXiv ID: 2603.03389

1️⃣ 一句话总结

arXiv ID: 2603.03072

1️⃣ 一句话总结

arXiv ID: 2603.03001

1️⃣ 一句话总结

arXiv ID: 2603.02865

1️⃣ 一句话总结

arXiv ID: 2603.02854

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.04334 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02684 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02658 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02547 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02760 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03389 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03072 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03001 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02865 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02854 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.04334

arXiv ID: 2603.02684

arXiv ID: 2603.02658

arXiv ID: 2603.02547

arXiv ID: 2603.02760

arXiv ID: 2603.03389

arXiv ID: 2603.03072

arXiv ID: 2603.03001

arXiv ID: 2603.02865

arXiv ID: 2603.02854