arXiv ID:
2604.18107
arXiv 提交日期: 2026-04-20
基于延迟反馈的测试时扰动学习用于视觉-语言-动作模型 / Test-Time Perturbation Learning with Delayed Feedback for Vision-Language-Action Models
1️⃣ 一句话总结
本文提出了一种名为PDF的免验证器测试时自适应框架,它通过不确定性数据增强、动作投票和轻量级扰动学习来纠正视觉-语言-动作模型在环境变化下的过拟合问题,从而显著提升了任务成功率,且无需微调基础模型。