arXiv ID:
2603.03969
arXiv 提交日期: 2026-03-04
从视觉基础模型扩展密集事件流预训练 / Scaling Dense Event-Stream Pretraining from Visual Foundation Models
1️⃣ 一句话总结
这篇论文提出了一种新的自监督预训练方法,通过从视觉基础模型中提取语义结构信息来指导事件流数据的学习,从而显著提升了事件表征的质量及其在下游任务中的性能。