arXiv最新AI论文速览速学

🔍

标签: #fact verification ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: AtomEval: Atomic Evaluation of Adversarial Claims in Fact Verification 04-10

arXiv ID: 2604.07967

arXiv 提交日期: 2026-04-09

llm natural language processing model evaluation fact verification adversarial evaluation claim decomposition validity scoring benchmark

AtomEval：事实核查中对抗性主张的原子化评估 / AtomEval: Atomic Evaluation of Adversarial Claims in Fact Verification

1️⃣ 一句话总结

这篇论文提出了一个名为AtomEval的新评估框架，它通过将事实主张拆解成原子成分并检查其真实性是否被破坏，从而更可靠地评估对抗性改写对事实核查系统的攻击效果，研究发现更强的AI模型未必能生成更有效的对抗性主张。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21387

arXiv 提交日期: 2026-01-29

llm natural language processing model evaluation evidence ranking fact verification information retrieval user study attribution

面向归因与事实核查的用户中心化证据排序 / User-Centric Evidence Ranking for Attribution and Fact Verification

1️⃣ 一句话总结

本文提出了一种名为‘证据排序’的新任务，通过将最充分的信息优先展示在列表前列来优化证据呈现方式，从而在保证所有证据可用的前提下，显著减少了用户核查事实时的阅读负担并提升了验证效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2509.22582

arXiv 提交日期: 2025-09-26

llm model evaluation natural language processing hallucination detection benchmark evaluation framework fact verification error localization

使用大语言模型进行上下文相关幻觉的细粒度检测 / Fine-Grained Detection of Context-Grounded Hallucinations Using LLMs

1️⃣ 一句话总结

这篇论文研究了如何利用大语言模型来精确定位文本生成中的幻觉问题，即模型输出无法从源文本验证的信息，并通过构建新基准和评估方法揭示了模型在此任务上的主要挑战和局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2509.11492

arXiv 提交日期: 2025-09-15

llm natural language processing model evaluation fact verification numerical claims lora fine-tuning evidence retrieval zero-shot prompting

ClaimIQ在CheckThat! 2025：比较基于提示与微调语言模型在验证数值声明中的表现 / ClaimIQ at CheckThat! 2025: Comparing Prompted and Fine-Tuned Language Models for Verifying Numerical Claims

1️⃣ 一句话总结

本研究探索了两种不同的AI方法——直接指令调用和精细参数调优，用于验证数字事实声明，发现精细调优的模型在训练数据上表现良好但泛化能力有限，强调了证据处理方式和模型适应对提升验证准确性的关键作用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.07967

1️⃣ 一句话总结

arXiv ID: 2601.21387

1️⃣ 一句话总结

arXiv ID: 2509.22582

1️⃣ 一句话总结

arXiv ID: 2509.11492

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.07967 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21387 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2509.22582 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2509.11492 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.07967

arXiv ID: 2601.21387

arXiv ID: 2509.22582

arXiv ID: 2509.11492