arXiv ID:
2606.18472
基于正则化微调的3D视觉-语言模型领域泛化适应 / Domain Generalizable Adaptation of 3D Vision-Language Models via Regularized Fine-Tuning
1️⃣ 一句话总结
本文提出了一种名为ReFine3D的微调框架,通过选择性地调整模型层并引入两种正则化策略——确保不同视角点云的一致性,以及利用同义词替换增强文本多样性——使得3D多模态模型在数据有限的场景下既能适应新任务,又不会遗忘原有能力,最终在多项测试中提升了模型对新类别、新数据集和干扰情况的泛化性能。