arXiv ID:
2606.09461
H2HMem:面向人人交互场景的智能体多模态记忆基准 / H2HMem: A Multimodal Memory Benchmark for Agents in Human-Human Interactions
1️⃣ 一句话总结
该论文提出了一个名为H2HMem的新型多模态记忆评估基准,专门用于测试AI智能体在人类与人类的复杂对话场景(如多人会议)中,记忆、推理和运用多模态信息的能力,发现现有智能体在这类任务上存在显著不足。