← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
详细标签: multimodal reasoning video question answering benchmark challenge automated evaluation advertising video understanding 或 搜索:

📄 论文总结

MARS2 2025:多模态推理与慢思维挑战赛

MARS2 2025: Multimodal Reasoning and Slow Thinking Challenge


1️⃣ 一句话总结

MARS2 2025是一个专注于多模态机器学习和大语言模型的大型基准测试挑战赛,通过发布Lens和AdsQA两个定制数据集,评估模型在现实世界通用场景和广告视频领域的复杂推理能力,吸引了76个团队参与并提交了1200多份作品。


2️⃣ 论文创新点

1. Lens多级多模态推理数据集

2. AdsQA广告视频问答数据集

3. 多赛道评估框架

4. 自动化评估与多数投票机制


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF