arXiv ID:
2606.29997
arXiv 提交日期: 2026-06-29
Rigel:基于自蒸馏分数自适应的图像与视频字幕评估方法 / Rigel: Self-Distilled Score Adaptation for Image and Video Captioning Evaluation
1️⃣ 一句话总结
本研究提出了一种名为Rigel的自动评估指标,通过从冻结的大语言模型中蒸馏出专门用于打分的模块,并借助人工标注数据微调,从而更准确地衡量图像和视频自动生成字幕的质量,在多个测试集上显著优于现有方法。