← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: agents
详细标签: smartphone agents privacy awareness multimodal llm gui interaction privacy benchmark 或 搜索:

📄 论文总结

SAPA-Bench:评估多模态大语言模型驱动的智能手机代理隐私意识的大规模基准

SAPA-Bench: A Large-Scale Benchmark for Evaluating Privacy Awareness of Multimodal Large Language Model-Driven Smartphone Agents


1️⃣ 一句话总结

该论文提出了首个专门评估智能手机代理隐私意识的大规模基准SAPA-Bench,包含7,138个真实场景,通过五个专用指标系统评估发现当前代理的隐私保护能力普遍不足,闭源模型表现优于开源模型。


2️⃣ 论文创新点

1. SAPA-Bench基准数据集

2. 五维隐私评估指标体系

3. 三级隐私敏感度分类

4. 人机协同五阶段标注流程


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF