arXiv ID:
2512.09663
arXiv 提交日期: 2025-12-10
IF-Bench:基于生成式视觉提示的红外图像多模态大语言模型评测与增强 / IF-Bench: Benchmarking and Enhancing MLLMs for Infrared Images with Generative Visual Prompting
1️⃣ 一句话总结
这篇论文创建了首个用于评估多模态大模型理解红外图像能力的基准测试IF-Bench,并发现了一种无需额外训练、通过将红外图像转换为语义对齐的RGB图像来显著提升模型性能的通用方法。