arXiv ID:
2601.18744
TSRBench:面向通用模型的综合性多任务多模态时间序列推理基准 / TSRBench: A Comprehensive Multi-task Multi-modal Time Series Reasoning Benchmark for Generalist Models
1️⃣ 一句话总结
这篇论文提出了一个名为TSRBench的综合性基准测试,用于全面评估通用模型在时间序列数据上的多模态推理能力,发现当前模型在语义理解和数值预测之间存在脱节,且难以有效融合文本与视觉信息。