arXiv最新AI论文速览速学

🔍

标签: #llm ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: MultiHedge: Adaptive Coordination via Retrieval-Augmented Control 05-02

arXiv ID: 2604.21549

arXiv 提交日期: 2026-04-23

llm machine learning model evaluation prevalence estimation multicalibration bias correction covariate shift classification

使用多校准大型语言模型进行无偏的流行率估计 / Unbiased Prevalence Estimation with Multicalibrated LLMs

1️⃣ 一句话总结

本文提出，通过多校准技术（确保模型在不同输入特征下均保持校准）而非传统平均校准，可以显著消除在人群特征分布变化时（如跨地区或跨场景）使用大语言模型或分类器进行类别比例估计的系统性偏差，并通过模拟和实际案例验证了这一方法的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21380

arXiv 提交日期: 2026-04-23

llm systems machine learning retrieval-augmented generation preference elicitation performance requirements software engineering interactive quantification

推测与询问：通过交互式检索增强偏好引导来量化软件性能需求 / Conjecture and Inquiry: Quantifying Software Performance Requirements via Interactive Retrieval-Augmented Preference Elicitation

1️⃣ 一句话总结

本文提出了一种名为IRAP的新方法，通过结合检索相关知识和与用户逐步交互，将模糊的软件性能自然语言需求自动转化为精确的数学函数，在实验中仅需少量交互就能大幅超越现有技术。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21204

arXiv 提交日期: 2026-04-23

llm machine learning agents reasoning occupation prediction fine-tuning llm-as-a-judge career modeling

下一职业推荐背后的推理机制研究 / On Reasoning Behind Next Occupation Recommendation

1️⃣ 一句话总结

本文提出一种让大语言模型先生成用户职业选择理由、再据此预测下一职业的两步推理方法，并通过微调小型模型和使用AI裁判筛选高质量理由，显著提升了职业预测的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21751

arXiv 提交日期: 2026-04-23

llm natural language processing model evaluation cultural bias regional bias dataset supervised fine-tuning evaluation

为什么所有大型语言模型都对日本文化着迷？——论大型语言模型中隐藏的文化与区域偏见 / Why are all LLMs Obsessed with Japanese Culture? On the Hidden Cultural and Regional Biases of LLMs

1️⃣ 一句话总结

该研究通过构建一个基于文化相关问题分类的新数据集，发现大型语言模型在文化回答中存在明显的区域偏好，尤其是对日本表现出异常倾向，并且这种偏见主要出现在监督微调阶段，而非预训练阶段。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21690

arXiv 提交日期: 2026-04-23

llm biology model evaluation genome language model explainability transformer dnabert-2 attention

评估基于Transformer的基因组语言模型DNABERT-2的事后解释 / Evaluating Post-hoc Explanations of the Transformer-based Genome Language Model DNABERT-2

1️⃣ 一句话总结

本文研究了如何为先进的基因组语言模型DNABERT-2生成可解释性分析，通过改进一种名为AttnLRP的方法，成功将模型对DNA序列的预测转化为人类可理解的生物学模式，并证明其解释质量与传统卷积神经网络模型相当。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21554

arXiv 提交日期: 2026-04-23

llm systems general ai governance eu ai act expert collaboration compliance action research

参与式人工智能治理：通过内部专家协作应对最后一公里挑战 / Engaged AI Governance: Addressing the Last Mile Challenge Through Internal Expert Collaboration

1️⃣ 一句话总结

本文针对欧盟AI法案落地难（即“最后一公里”挑战），通过在一家AI初创公司开展内部行动研究，提出了一套将法律文本转化为具体行动的方法，并发现从业人员对合规要求存在三种态度（认可、已满足、抵触），只有让专家共同参与治理过程，才能将外部法规变为内部自觉，避免流于表面应付。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21479

arXiv 提交日期: 2026-04-23

llm autonomous driving machine learning trajectory prediction spatio-temporal reasoning map understanding frozen llm

冻结大语言模型作为用于车辆轨迹预测的地图感知时空推理器 / Frozen LLMs as Map-Aware Spatio-Temporal Reasoners for Vehicle Trajectory Prediction

1️⃣ 一句话总结

本文提出一种新方法，利用未经额外训练的大语言模型（LLM）结合车辆轨迹和道路地图信息来预测车辆未来行驶路径，仅需简单适配即可提升预测准确性，为自动驾驶中的轨迹预测提供了一种高效、通用的推理框架。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21649

arXiv 提交日期: 2026-04-23

llm knowledge graph completion machine learning quantization codebook learning hierarchical encoding semantic alignment generative reconstruction

GS-Quant：面向知识图谱补全的粒度语义与生成式结构量化方法 / GS-Quant: Granular Semantic and Generative Structural Quantization for Knowledge Graph Completion

1️⃣ 一句话总结

本文提出了一种名为GS-Quant的新框架，通过将知识图谱中的实体编码为从粗到细的层级化离散代码（先概括大类后细化细节），并结合代码间的因果依赖关系，让大语言模型能像理解自然语言一样理解图结构，从而显著提升知识图谱补全的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21916

arXiv 提交日期: 2026-04-23

llm evaluation benchmark self-play mathematical reasoning problem posing co-evolving difficulty

数学对决：评估大型语言模型既出题又解题的能力 / MathDuels: Evaluating LLMs as Problem Posers and Solvers

1️⃣ 一句话总结

本文提出了一种名为MathDuels的新型评估方法，让大语言模型在对抗性环境中既扮演“出题者”又扮演“解题者”，从而揭示出传统静态测试无法区分的模型能力差异，并且随着更强模型的加入，题目难度会自动提升、避免测试天花板效应。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21209

arXiv 提交日期: 2026-04-23

llm natural language processing model training finetuning preference alignment hallucination mitigation online reviews curriculum learning

将生成式人工智能与人类偏好对齐：一种用于在线评论管理的大型语言模型微调新方法 / Align Generative Artificial Intelligence with Human Preferences: A Novel Large Language Model Fine-Tuning Method for Online Review Management

1️⃣ 一句话总结

本文提出了一种新的偏好微调方法，通过减少模型幻觉、自动构建人类偏好对以及创新性地放松离线策略的过度保守性，使通用大语言模型能更精准地根据领域内人类偏好生成在线评论回复。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.21549

1️⃣ 一句话总结

arXiv ID: 2604.21380

1️⃣ 一句话总结

arXiv ID: 2604.21204

1️⃣ 一句话总结

arXiv ID: 2604.21751

1️⃣ 一句话总结

arXiv ID: 2604.21690

1️⃣ 一句话总结

arXiv ID: 2604.21554

1️⃣ 一句话总结

arXiv ID: 2604.21479

1️⃣ 一句话总结

arXiv ID: 2604.21649

1️⃣ 一句话总结

arXiv ID: 2604.21916

1️⃣ 一句话总结

arXiv ID: 2604.21209

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.21549 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21380 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21204 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21751 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21690 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21554 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21479 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21649 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21916 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21209 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.21549

arXiv ID: 2604.21380

arXiv ID: 2604.21204

arXiv ID: 2604.21751

arXiv ID: 2604.21690

arXiv ID: 2604.21554

arXiv ID: 2604.21479

arXiv ID: 2604.21649

arXiv ID: 2604.21916

arXiv ID: 2604.21209