arXiv最新AI论文速览速学

🔍

natural language processing ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: What Kind of Language is Easy to Language-Model Under Curriculum Learning? 05-02

arXiv ID: 2604.19069

arXiv 提交日期: 2026-04-21

natural language processing model training dataset artifacts debiasing product-of-experts natural language inference spurious correlations

专家乘积训练减少自然语言推理中的数据集伪影 / Product-of-Experts Training Reduces Dataset Artifacts in Natural Language Inference

1️⃣ 一句话总结

这篇论文提出了一种名为“专家乘积”（PoE）的训练方法，通过降低模型对数据集中虚假相关性的依赖，有效减少了自然语言推理任务中常见的偏见，在不显著损失准确率的前提下提升了模型的真实推理能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19189

arXiv 提交日期: 2026-04-21

llm natural language processing behavior memorability pronoun insertion headline cognitive psychology text revision

令人难忘的标题：插入人称代词能否增强记忆效果？ / Headlines You Won't Forget: Can Pronoun Insertion Increase Memorability?

1️⃣ 一句话总结

本研究通过认知心理学实验和大型语言模型工具，探讨了在新闻标题中插入第一、第二人称代词是否能让读者更容易记住标题内容，结果发现这种插入的效果并不统一，取决于标题主题、插入方式及上下文，并且用AI自动修改可能损害内容的准确性和自然性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18169

arXiv 提交日期: 2026-04-20

llm natural language processing evaluation literary translation creativity comprehension benchmark prompt engineering

超越复制：评估文学翻译中LLM理解与创造力的配对任务框架 / Beyond Reproduction: A Paired-Task Framework for Assessing LLM Comprehension and Creativity in Literary Translation

1️⃣ 一句话总结

本文提出了一个能同时评估大语言模型在文学翻译中“理解原文”和“创造性翻译”能力的配对任务框架，通过分析11本书籍的翻译表现发现，即使模型能很好地理解原文，其创造性翻译水平（如处理隐喻和文字游戏）仍远低于人类，且简单的提示词改进只能带来微小提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.17822

arXiv 提交日期: 2026-04-20

machine learning computer vision natural language processing class-incremental learning clip task routing knowledge distillation orthogonal compensation

GR4CIL：基于CLIP的类增量学习中的间隙补偿路由 / GR4CIL: Gap-compensated Routing for CLIP-based Class Incremental Learning

1️⃣ 一句话总结

本文提出GR4CIL方法，通过保留任务专属视觉知识、维护稳定共享文本语义空间，并引入正交补偿机制来减小模态差异导致的偏差，从而在利用CLIP模型进行类增量学习时，实现更可靠的任务识别与知识路由，同时不损失零样本泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.17930

arXiv 提交日期: 2026-04-20

llm natural language processing data linguistic competence data augmentation synthetic data blimp grammar

语言模型形式语言能力的异质性：数据真的是瓶颈吗？ / Heterogeneity in Formal Linguistic Competence of Language Models: Is Data the Real Bottleneck?

1️⃣ 一句话总结

本文通过向训练数据中仅注入1%的针对性合成文本，发现小型语言模型在大多数原本表现不佳的语法现象上性能大幅提升，表明数据稀缺而非架构缺陷才是主因，但部分顽固语法错误仍无法通过数据增强解决。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18712

arXiv 提交日期: 2026-04-20

llm natural language processing cognitive science reading times eye-tracking surprisal linear probing human processing

探测语言模型中的阅读时间 / Probing for Reading Times

1️⃣ 一句话总结

本研究通过分析五种语言的眼动数据，发现语言模型早期层级的表征能有效预测人类阅读中的早期注视行为（如首次注视时长），而传统的概率预测指标（如惊讶度）则在预测整体阅读时长上表现更佳，揭示了模型深度与人类阅读时间阶段之间存在功能上的对齐关系。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18254

arXiv 提交日期: 2026-04-20

llm natural language processing model training text-to-sql curriculum learning code generation modular adapters fine-tuning

LeGo-Code：模块化课程学习能否推动复杂代码生成？来自Text-to-SQL任务的见解 / LeGo-Code: Can Modular Curriculum Learning Advance Complex Code Generation? Insights from Text-to-SQL

1️⃣ 一句话总结

这篇论文提出了一种名为‘模块化适配器组合’的新方法，通过像搭乐高一样分阶段、由易到难地训练AI模型，有效解决了当前大语言模型在处理复杂数据库查询语句时遇到的困难，从而提升了模型生成复杂代码的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18226

arXiv 提交日期: 2026-04-20

natural language processing llm data synthetic data generation sentiment analysis multilingual nlp backtranslation privacy preservation

模型在困境中：针对法语合成社交媒体数据的情绪分析 / Model in Distress: Sentiment Analysis on French Synthetic Social Media

1️⃣ 一句话总结

这篇论文提出了一种通用的合成数据生成方法，通过反向翻译等技术，仅用少量初始数据就生成了大量法语社交媒体文本，成功训练出能准确识别用户不满情绪的模型，同时解决了标注成本高、多语言数据稀缺和用户隐私保护的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18328

arXiv 提交日期: 2026-04-20

llm natural language processing theory neuro-symbolic syllogistic reasoning ensemble methods formal verification content robustness

FregeLogic在SemEval 2026任务11中的表现：一种用于内容鲁棒三段论有效性预测的混合神经符号架构 / FregeLogic at SemEval 2026 Task 11: A Hybrid Neuro-Symbolic Architecture for Content-Robust Syllogistic Validity Prediction

1️⃣ 一句话总结

这篇论文提出了一个名为FregeLogic的混合系统，它巧妙地结合了多个大语言模型和一个形式逻辑求解器，专门用来判断三段论推理是否有效，并且能有效降低推理内容本身对判断结果产生的误导性影响。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.17968

arXiv 提交日期: 2026-04-20

llm natural language processing model evaluation human annotation perspective-taking collective judgment bias analysis subjective tasks

从备选到前线：大语言模型何时能成为人类视角的卓越标注者？ / From Fallback to Frontline: When Can LLMs be Superior Annotators of Human Perspectives?

1️⃣ 一句话总结

这篇论文研究发现，在预测特定人群对主观问题的集体意见时，大语言模型因其低方差和结构特性，常常能比人类标注者（包括群体内部成员）表现得更好，从而可以作为一种有原则的工具，而不仅仅是节省成本的替代方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.19069

1️⃣ 一句话总结

arXiv ID: 2604.19189

1️⃣ 一句话总结

arXiv ID: 2604.18169

1️⃣ 一句话总结

arXiv ID: 2604.17822

1️⃣ 一句话总结

arXiv ID: 2604.17930

1️⃣ 一句话总结

arXiv ID: 2604.18712

1️⃣ 一句话总结

arXiv ID: 2604.18254

1️⃣ 一句话总结

arXiv ID: 2604.18226

1️⃣ 一句话总结

arXiv ID: 2604.18328

1️⃣ 一句话总结

arXiv ID: 2604.17968

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.19069 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19189 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18169 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.17822 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.17930 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18712 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18254 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18226 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18328 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.17968 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.19069

arXiv ID: 2604.19189

arXiv ID: 2604.18169

arXiv ID: 2604.17822

arXiv ID: 2604.17930

arXiv ID: 2604.18712

arXiv ID: 2604.18254

arXiv ID: 2604.18226

arXiv ID: 2604.18328

arXiv ID: 2604.17968