← 返回列表

菜单

🤖 系统
📄 Abstract - RefusalBench: A Generative Evaluation Framework for Selective Refusal in RAG Systems
正在获取摘要...
顶级标签: llm
详细标签: selective refusal rag systems generative evaluation uncertainty handling safety evaluation 或 搜索:

📄 论文总结

RefusalBench:面向检索增强生成系统中选择性拒绝能力的生成式评估框架 / RefusalBench: A Generative Evaluation Framework for Selective Refusal in RAG Systems


1️⃣ 一句话总结

RefusalBench是一个通过程序化生成测试用例来评估语言模型在不确定性情况下选择性拒绝能力的生成式评估框架,揭示了当前模型在该能力上的系统性缺陷。


2️⃣ 论文创新点

1. 生成式评估方法

2. 选择性拒绝能力诊断框架

3. 生成器-验证器流水线


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF