arXiv ID:
2606.21861
arXiv 提交日期: 2026-06-20
零样本视觉语言模型在课堂参与度识别中的应用:提示敏感性与跨数据集泛化的基准研究 / Zero-Shot Vision-Language Models for Classroom Engagement Recognition: A Benchmark Study of Prompt Sensitivity and Cross-Dataset Generalization
1️⃣ 一句话总结
该研究系统评估了五种主流视觉语言模型在零样本条件下识别学生课堂参与度的表现,发现这些模型在个体学生识别上近乎随机、易将所有样本归类为同一等级,且结果高度依赖提示词措辞,但在场景级分类中有较好效果,为教育AI应用提供了重要性能基准和设计警示。