arXiv ID:
2508.16697
arXiv 提交日期: 2025-08-22
QueryBandits:一种基于上下文多臂老虎机的查询重写框架,用于主动减少大语言模型的幻觉生成 / QueryBandits for Hallucination Mitigation: Exploiting Semantic Features for No-Regret Rewriting
1️⃣ 一句话总结
本文提出了QueryBandits框架,它将查询重写建模为一个在线决策问题,利用查询的语义特征,通过上下文多臂老虎机方法动态选择最佳重写策略,以主动减少大语言模型(LLM)的幻觉生成,并在多个问答基准上显著优于静态重写和无重写基线。