arXiv ID:
2606.23092
arXiv 提交日期: 2026-06-22
PIVOTSBench:评估多模态大语言模型在细粒度人际关系推理中的能力 / PIVOTSBench: Evaluating Fine-Grained Interpersonal Relationship Reasoning in Multimodal Large Language Models
1️⃣ 一句话总结
该论文提出了PIVOTS基准测试,通过整合视频、对话和心理学维度,首次系统评估多模态大语言模型在双向、细微人际关系判断上的表现,并分析了视觉线索和社交角色对推理的影响。