arXiv ID:
2604.27553
arXiv 提交日期: 2026-04-30
揭示视觉文本样式对大型视觉语言模型生成属性描述的影响 / Revealing the Impact of Visual Text Style on Attribute-based Descriptions Produced by Large Visual Language Models
1️⃣ 一句话总结
本研究通过实验发现,即使大型视觉语言模型能正确识别图片中的文字内容,文字的视觉样式(如字体、颜色、大小)仍会显著影响模型对该文字所指概念生成的属性描述,表明模型存在“样式泄漏”问题,亟需引入样式感知的评估与缓解策略。