← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: llm agents
详细标签: human reasoning styles social deduction games dynamic adaptation cognitive modeling player identification 或 搜索:

📄 论文总结


1️⃣ 一句话总结

这篇论文提出了InMind框架,通过社交推理游戏(如Avalon)和双层次认知标注(策略追踪与反思总结),首次系统评估了大语言模型(LLMs)在捕捉和模拟个体化推理风格上的能力,揭示了当前模型在动态社交推理中的局限性,并为LLMs的个性化认知评估提供了新范式。


2️⃣ 论文创新点

1. InMind评估框架

2. InMind-Avalon数据集

3. 认知驱动的评估任务

4. 动态适应性评估协议


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表


📄 打开原文 PDF