arXiv ID:
2604.06748
arXiv 提交日期: 2026-04-08
从静态到交互:将视觉上下文学习模型适配于用户驱动任务 / From Static to Interactive: Adapting Visual in-Context Learners for User-Driven Tasks
1️⃣ 一句话总结
这篇论文提出了一种简单有效的方法,将原本只能被动接受示例的静态视觉上下文学习模型,改造成能通过用户涂鸦、点击或画框等自然交互方式进行实时引导和控制的智能系统,从而在图像分割、超分辨率和对象移除等任务上显著提升了交互性能。