arXiv ID:
2603.28251
arXiv 提交日期: 2026-03-30
DiffAttn:基于扩散模型和LLM增强语义推理的驾驶员视觉注意力预测 / DiffAttn: Diffusion-Based Drivers' Visual Attention Prediction with LLM-Enhanced Semantic Reasoning
1️⃣ 一句话总结
这篇论文提出了一个名为DiffAttn的新框架,它利用扩散模型来预测驾驶员在驾驶时会看向哪里,并通过结合大型语言模型来增强对道路安全关键信息的理解,从而在多个测试中取得了当前最好的预测效果。