arXiv最新AI论文速览速学

🔍

标签: #language models ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 100 最新: On the Proper Treatment of Units in Surprisal Theory 05-01

arXiv ID: 2604.28147

arXiv 提交日期: 2026-04-30

natural language processing llm surprisal theory tokenization unit of analysis psycholinguistics language models

论惊奇理论中语言单位的正确处理 / On the Proper Treatment of Units in Surprisal Theory

1️⃣ 一句话总结

这篇论文揭示了惊奇理论研究中一个被忽视的问题：研究者通常用不同标准定义语言单位（如词与子词），导致实验结果不可靠，并提出了一个统一框架来明确分析单位和评估区域，从而让惊异度预测更科学、可重复。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27533

arXiv 提交日期: 2026-04-30

natural language processing model evaluation audio speech recognition rescoring language models error analysis semantic metrics

语音识别中语言模型重新评分方法的定性评估 / Qualitative Evaluation of Language Model Rescoring in Automatic Speech Recognition

1️⃣ 一句话总结

本文提出两种新的评估指标——词性错误率和嵌入错误率，分别从语法和语义角度分析语言模型在语音识别后处理中的实际贡献，弥补了传统词错误率仅关注替换、删除和插入错误数量而忽略语言质量的不足。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.14140

arXiv 提交日期: 2026-04-15

llm benchmark model evaluation chain-of-thought reasoning long-horizon evaluation language models

LongCoT：长链条思维推理基准测试 / LongCoT: Benchmarking Long-Horizon Chain-of-Thought Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为LongCoT的新基准测试，专门用来衡量AI模型在解决需要多步骤、长链条推理的复杂问题时的能力，结果显示当前最先进的模型在这方面的表现仍然很差。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20743

arXiv 提交日期: 2026-02-24

natural language processing llm systems text anonymization privacy-utility trade-off prompt optimization language models benchmark

自适应文本匿名化：通过提示优化学习隐私与效用的权衡 / Adaptive Text Anonymization: Learning Privacy-Utility Trade-offs via Prompt Optimization

1️⃣ 一句话总结

这篇论文提出了一种能自动适应不同场景需求的自适应文本匿名化框架，通过优化提示让语言模型在保护隐私和保留文本可用性之间找到最佳平衡点，效果优于传统固定方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.15332

arXiv 提交日期: 2026-02-17

llm model evaluation theory interpretability reasoning analysis causal attribution trajectory analysis language models

方向性推理轨迹变化（DRTC）：识别推理模型中的关键轨迹段 / Directional Reasoning Trajectory Change (DRTC): Identifying Critical Trace Segments in Reasoning Models

1️⃣ 一句话总结

这篇论文提出了一种名为DRTC的新方法，它通过分析模型在推理过程中不确定性和概率分布的变化，来精准定位并量化是哪些前文信息真正‘扭转’了模型的推理方向，从而帮助我们理解大语言模型是如何一步步思考的。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.09826

arXiv 提交日期: 2026-02-10

natural language processing llm model evaluation cross-lingual transfer arabic dialects language models probing representational similarity

从标准语到方言：探索阿拉伯语语言模型中的跨语言迁移 / From FusHa to Folk: Exploring Cross-Lingual Transfer in Arabic Language Models

1️⃣ 一句话总结

这篇论文研究发现，主要基于现代标准阿拉伯语训练的AI语言模型，在迁移到不同阿拉伯语方言时效果不均，方言与标准语的相似度及地理邻近性影响迁移效果，且同时支持所有方言可能导致模型性能相互干扰。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.17277

arXiv 提交日期: 2026-01-24

natural language processing benchmark multi-modal code-switching multilingual dialogue benchmark dataset dialogue evaluation language models

PingPong：多轮语码转换对话的自然基准 / PingPong: A Natural Benchmark for Multi-Turn Code-Switching Dialogues

1️⃣ 一句话总结

这篇论文提出了一个名为PingPong的新基准数据集，它包含了真实、多线程的多语言混合对话，用于评估和改进自然语言处理模型在处理复杂、自然的语码转换对话方面的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.10858

arXiv 提交日期: 2025-12-11

model training natural language processing llm scaling laws discrete diffusion language models noise type parameter efficiency

离散扩散语言模型的缩放行为研究 / Scaling Behavior of Discrete Diffusion Language Models

1️⃣ 一句话总结

这篇论文研究发现，作为自回归模型替代方案的离散扩散语言模型，其性能随规模扩展的规律（缩放定律）与噪声类型密切相关，其中均匀扩散模型在数据有限时更具优势，并通过训练百亿参数模型验证了这一规律。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.09541

arXiv 提交日期: 2025-10-10

model training natural language processing llm diffusion models reinforcement learning policy gradient language models alignment

SPG：面向掩码扩散语言模型的三明治策略梯度方法 / SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models

1️⃣ 一句话总结

本文提出了一种名为三明治策略梯度（SPG）的新方法，通过同时利用对数似然的上界和下界来减少策略梯度偏差，从而更有效地训练扩散大语言模型以符合人类偏好或任务奖励，在多个推理任务上显著超越了现有强化学习方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.08549

arXiv 提交日期: 2025-10-09

model training machine learning llm entropy regularization activation functions reinforcement learning language models image classification

熵正则化激活：通过激活函数作为熵约束提升连续控制、大语言模型和图像分类性能 / Entropy Regularizing Activation: Boosting Continuous Control, Large Language Models, and Image Classification with Activation as Entropy Constraints

1️⃣ 一句话总结

该论文提出了一种名为ERA的新方法，通过设计特殊的激活函数来约束模型输出的熵值，从而在多个领域显著提升性能，包括大语言模型的数学推理能力、强化学习智能体的控制效果以及图像分类的准确率，且计算开销极小。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.28147

1️⃣ 一句话总结

arXiv ID: 2604.27533

1️⃣ 一句话总结

arXiv ID: 2604.14140

1️⃣ 一句话总结

arXiv ID: 2602.20743

1️⃣ 一句话总结

arXiv ID: 2602.15332

1️⃣ 一句话总结

arXiv ID: 2602.09826

1️⃣ 一句话总结

arXiv ID: 2601.17277

1️⃣ 一句话总结

arXiv ID: 2512.10858

1️⃣ 一句话总结

arXiv ID: 2510.09541

1️⃣ 一句话总结

arXiv ID: 2510.08549

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.28147 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27533 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.14140 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20743 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.15332 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.09826 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.17277 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.10858 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.09541 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.08549 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.28147

arXiv ID: 2604.27533

arXiv ID: 2604.14140

arXiv ID: 2602.20743

arXiv ID: 2602.15332

arXiv ID: 2602.09826

arXiv ID: 2601.17277

arXiv ID: 2512.10858

arXiv ID: 2510.09541

arXiv ID: 2510.08549