arXiv ID:
2604.26235
arXiv 提交日期: 2026-04-29
LATTICE:评估加密代理的决策支持效用 / LATTICE: Evaluating Decision Support Utility of Crypto Agents
1️⃣ 一句话总结
该论文提出了LATTICE基准,通过六个评估维度和十六种任务类型,利用大语言模型自动评分,系统性地衡量加密代理在实际用户场景中辅助决策的能力,并通过对六个真实加密助手的测试揭示了不同代理在决策支持质量上的关键差异。