arXiv ID:
2606.03345
超越语义:从视觉-语言数据中建模事实与情感感知体验 / Beyond Semantics: Modeling Factual and Affective Perceptual Experiences from Vision-Language Data
1️⃣ 一句话总结
本文提出了一种名为P-Topics的新方法,通过两阶段变换器模型(PercepT),自动从图像与文字描述中挖掘出反映不同文化下人们对同一图像的事实和情感感知模式,从而超越单纯语义分析,更准确地理解图像如何被不同人群主观地感受。