arXiv ID:
2510.22282
arXiv 提交日期: 2025-10-25
CityRiSE:通过强化学习在视觉语言模型中推理城市社会经济状况 / CityRiSE: Reasoning Urban Socio-Economic Status in Vision-Language Models via Reinforcement Learning
1️⃣ 一句话总结
这项研究提出了一种名为CityRiSE的新方法,通过强化学习指导大型视觉语言模型从街景和卫星图像中识别关键视觉线索,从而更准确、可解释地预测城市社会经济状况,并在不同城市和指标上展现出更强的泛化能力。