arXiv ID:
2602.11340
arXiv 提交日期: 2026-02-11
面向多模态大语言模型作为评估者的双层提示优化 / Bi-Level Prompt Optimization for Multimodal LLM-as-a-Judge
1️⃣ 一句话总结
本文提出了一种名为BLPO的双层提示优化框架,通过将图像转换为保留关键视觉信息的文本表示,有效解决了多模态大模型在评估生成图像时因上下文限制而难以优化提示的难题,从而显著提升了AI评估结果与人类判断的一致性。