← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
详细标签: masked autoencoder social behavior understanding self-supervised learning multimodal fusion affective computing 或 搜索:

📄 论文总结

基于掩码自编码器的多模态社交行为理解模型

Social-MAE: A Masked Autoencoder for Multimodal Social Behavior Understanding


1️⃣ 一句话总结

Social-MAE是一种基于Transformer的多模态掩码自编码器,通过扩展CAV-MAE架构支持多帧输入,在VoxCeleb2数据集上进行自监督预训练,在情感识别、笑声检测和人格特质估计等社交任务上达到了最先进或具有竞争力的性能。


2️⃣ 论文创新点

1. 多帧输入改进

2. 领域自适应预训练

3. 多模态掩码自编码


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF