← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: llm
详细标签: query rewriting hallucination reduction contextual bandits semantic features reward modeling 或 搜索:

📄 论文总结

QueryBandits:基于上下文多臂老虎机的查询重写框架以减少LLM幻觉

QueryBandits: A Contextual Multi-Armed Bandit Framework for Query Rewriting to Reduce LLM Hallucination


1️⃣ 一句话总结

该论文提出了QueryBandits框架,通过多臂老虎机算法动态选择查询重写策略,利用17个语义特征预测幻觉倾向,在13个QA基准测试中相比无重写基线获得87.5%胜率,显著优于静态提示方法。


2️⃣ 论文创新点

1. QueryBandits框架

2. 语义特征驱动的奖励模型

3. 多策略查询重写框架

4. 复合奖励模型


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF