arXiv ID:
2603.04123
arXiv 提交日期: 2026-03-04
FINEST:通过细粒度评估改进大语言模型对敏感话题的回应 / FINEST: Improving LLM Responses to Sensitive Topics Through Fine-Grained Evaluation
1️⃣ 一句话总结
这篇论文提出了一个名为FINEST的细粒度评估框架,通过将敏感话题的回复质量分解为内容、逻辑和得体性三个维度的具体错误,指导大语言模型进行针对性改进,从而在保持安全性的同时显著提升回答的有用性。