arXiv ID:
2605.29400
arXiv 提交日期: 2026-05-28
面向屏幕条件动作预测的架构敏感型监督微调:PiSAR基准研究 / Architecture-Sensitive Supervised Fine-Tuning for Screen-Conditioned Action Prediction: A PiSAR Benchmark
1️⃣ 一句话总结
本文通过构建包含约1.3万个屏幕行为记录的数据集PiSAR,对比了多种模型的性能,发现对特定架构(如Qwen3-VL-8B)进行微调后,其预测准确率远超顶尖的零样本模型(如GPT-5.5),但在某些大参数模型(如Gemma-4-26B)上微调效果不佳,表明微调效果高度依赖于模型架构与训练方法的匹配度。