arXiv ID:
2601.14724
HERMES:将KV缓存作为分层内存以实现高效的流式视频理解 / HERMES: KV Cache as Hierarchical Memory for Efficient Streaming Video Understanding
1️⃣ 一句话总结
本文提出了一种名为HERMES的新方法,它巧妙地将模型处理视频时产生的中间数据(KV缓存)组织成分层记忆,从而在无需额外训练的情况下,实现了对连续视频流的实时、准确理解,同时大幅降低了计算和内存开销。