arXiv ID:
2606.11543
SkillJuror:衡量智能体技能组织如何改变运行时行为 / SkillJuror: Measuring How Agent Skill Organization Changes Runtime Behavior
1️⃣ 一句话总结
本文提出了一个名为SkillJuror的评估框架,通过对比两种技能组织方式(渐进式展开与扁平式基线),发现技能的组织结构而非仅技能内容本身,会显著影响大语言模型智能体在运行时如何查找和应用知识,从而改变任务执行行为,但最终效果提升取决于任务特性。