arXiv ID:
2601.13836
FutureOmni:评估多模态大语言模型基于全模态上下文进行未来预测的能力 / FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs
1️⃣ 一句话总结
这篇论文提出了首个用于评估多模态大模型根据音频和视频线索预测未来事件能力的基准测试FutureOmni,发现现有模型在此任务上表现不佳,并提出了一个有效的训练策略来提升其预测能力。