arXiv ID:
2604.08545
arXiv 提交日期: 2026-04-09
明智行动:在具身多模态模型中培养元认知工具使用能力 / Act Wisely: Cultivating Meta-Cognitive Tool Use in Agentic Multimodal Models
1️⃣ 一句话总结
这篇论文提出了一个名为HDPO的新框架,旨在解决当前多模态AI代理在决定何时使用外部工具时存在的‘元认知缺陷’问题,该框架通过将任务准确性和工具使用效率分开优化,成功训练出既能大幅减少不必要工具调用、又能提升推理准确性的智能模型Metis。