arXiv ID:
2604.05377
arXiv 提交日期: 2026-04-07
UAVReason:一个用于多模态航空场景推理与生成的统一大规模基准 / UAVReason: A Unified, Large-Scale Benchmark for Multimodal Aerial Scene Reasoning and Generation
1️⃣ 一句话总结
这篇论文提出了首个专门针对无人机俯拍视角的大规模多模态基准数据集UAVReason,它整合了视觉问答、时序推理和图像生成等多种任务,并通过实验证明,采用统一的多任务学习方法能显著提升人工智能模型对复杂高空场景的理解和生成能力。