arXiv ID:
2603.15237
用于物理基础异常检测的多轮物理信息视觉语言模型 / Multi-turn Physics-informed Vision-language Model for Physics-grounded Anomaly Detection
1️⃣ 一句话总结
这项研究通过在多轮对话中融入物体属性、运动规律等物理知识,显著提升了通用视觉语言模型在检测违反物理规律的动态异常(如不规则旋转)方面的能力,使其性能远超现有最佳方法。