arXiv ID:
2604.20545
arXiv 提交日期: 2026-04-22
测量机器:将生成式AI评估为多元社会技术系统 / Measuring the Machine: Evaluating Generative AI as Pluralist Sociotechical Systems
1️⃣ 一句话总结
本文提出生成式AI不能仅靠静态基准测试来评估,而应视为一个由模型、用户和社会制度共同塑造的多元社会技术系统,并为此开发了“机器-社会-人类循环”(MaSH Loops)框架,通过案例展示价值观如何在交互中被动态构建和评估。