← 返回列表

菜单

🤖 系统
📄 Abstract - TrustJudge: Resolving Inconsistencies in LLM-as-a-Judge Frameworks
正在获取摘要...
顶级标签: llm systems
详细标签: llm evaluation inconsistency resolution probabilistic framework preference aggregation benchmark 或 搜索:

📄 论文总结

TrustJudge:解决LLM作为评估者框架中的不一致性问题

TrustJudge: Resolving Inconsistencies in LLM-as-a-Judge Frameworks


1️⃣ 一句话总结

论文提出了TrustJudge概率评估框架,通过分布敏感评分和似然感知聚合有效解决了LLM作为评估者系统中的评分比较不一致性和成对传递性不一致性问题。


2️⃣ 论文创新点

1. TrustJudge概率框架

2. 分布敏感评分

3. 似然感知聚合

4. 容忍度超参数δ


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF