arXiv ID:
2604.02151
arXiv 提交日期: 2026-04-02
基于拍卖机制的在线策略自适应方法应对动态变化目标 / Auction-Based Online Policy Adaptation for Evolving Objectives
1️⃣ 一句话总结
这篇论文提出了一种像拍卖会一样让多个目标‘竞价’决策的智能体学习框架,当任务目标动态增减时,只需简单增删对应模块即可快速适应,无需重新训练整个系统。