← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: llm
详细标签: human-centered interaction multimodal benchmark prompt optimization audio-visual-text integration social reasoning 或 搜索:

📄 论文总结


1️⃣ 一句话总结

本文提出了HumanSense基准,这是一个针对多模态大语言模型(MLLMs)在人类中心化交互场景中的感知、理解和响应能力的系统性评估框架,通过全模态(omni-modal)数据整合和分层任务设计,揭示了当前模型的局限性(如长上下文推理不足),并提出了无需训练即可提升性能的提示增强方法,为未来通用人工智能的发展提供了重要评估工具。


2️⃣ 论文创新点

1. HumanSense分层评估框架

2. 全模态推理与数据增强

3. 训练无关的提示优化

4. 人类基准与模态消融分析


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表


(注:术语已去重合并,优先保留核心模型、基准及方法论相关条目。)

📄 打开原文 PDF