arXiv ID:
2607.02025
arXiv 提交日期: 2026-07-02
评估视觉语言模型作为尼日利亚车牌识别的零样本学习替代方案:超越YOLO与光学字符识别 / Evaluating Vision-Language Models as a Zero-Shot Learning Alternative to You Only Look Once and Optical Character Recognition for Nigerian License Plate Recognition
1️⃣ 一句话总结
本研究比较了五种视觉语言模型(如Gemini和Qwen)与传统的YOLO+OCR方案在尼日利亚复杂真实场景下的车牌识别性能,发现视觉语言模型在零样本条件下表现更优,尤其Gemini和Qwen在字符准确率和鲁棒性上显著领先。