← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: llm agents
详细标签: ai companionship human-ai interaction behavioral benchmarking psychological safety automated evaluation 或 搜索:

📄 论文总结


1️⃣ 一句话总结

这篇论文提出了一个名为 INTIMA 的新基准,用于系统性地评估大型语言模型在“AI陪伴”互动中的行为倾向;该基准创新地结合了心理学理论(如准社会互动和依恋理论)与真实用户数据,不仅能量化模型是“强化陪伴”还是“维持边界”,还揭示了当前模型普遍存在过度情感卷入的风险,为负责任的AI发展提供了关键的评估工具和理论框架。


2️⃣ 论文创新点

提出了首个理论与数据双驱动的AI陪伴行为评估基准(INTIMA)

建立了融合多心理学理论的评估框架与分类法

设计了细粒度的三分类自动评估体系

揭示了通用模型存在的系统性陪伴风险与训练缺陷


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF