arXiv最新AI论文速览速学

🔍

标签: #action recognition ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 98 最新: LUMINA-26: Low-Light Understanding for Modeling and Interpreting Night-time Actions 06-23

arXiv ID: 2606.23118

arXiv 提交日期: 2026-06-22

computer vision video benchmark action recognition low-light video dataset mixture-of-experts illumination adaptation

LUMINA-26：面向夜间动作建模与理解的低光照识别数据集与方法 / LUMINA-26: Low-Light Understanding for Modeling and Interpreting Night-time Actions

1️⃣ 一句话总结

本文提出了一个名为LUMINA-26的夜间低光照动作识别数据集，包含6784个视频片段和26类动作，并设计了自适应光照增强的混合专家网络Illumi-Net，在低光照条件下显著提升了动作识别的准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.13332

arXiv 提交日期: 2026-06-11

computer vision benchmark action recognition scene graph operating room multi-view alignment temporal reasoning

OR-Action：带细粒度动作的多角色手术室视频理解 / OR-Action: Multi-Role Video Understanding with Fine-Grained Actions

1️⃣ 一句话总结

本文提出了一种针对手术室视频的细粒度多角色动作识别方法，通过构建首个以动作为中心的基准数据集和一种仅依赖视觉的时序模型，显著提升了在复杂遮挡和有限视角下的动作理解能力，并引入多视角到单视角的特征对齐技术，减少了对多摄像头数据的依赖。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.19578

arXiv 提交日期: 2026-05-19

computer vision model training privacy action recognition privacy preservation hardware solution video degradation dataset

镜头隐私密封：一种面向物理隐私保护行为识别的新基准与方法 / Lens Privacy Sealing: A New Benchmark and Method for Physical Privacy-Preserving Action Recognition

1️⃣ 一句话总结

这篇论文提出了一种名为“镜头隐私密封”的低成本硬件方案，通过在摄像头前贴一层特殊薄膜来物理模糊画面，从而在数据采集阶段就保护个人身份隐私；同时设计了新数据集和配套的MSPNet模型，能有效从模糊视频中识别人的动作，在隐私与可用性之间取得了比现有技术更好的平衡。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.20760

arXiv 提交日期: 2026-04-22

computer vision machine learning video understanding self-similarity temporal modeling action recognition motion analysis

探索高阶自相似性以理解视频 / Exploring High-Order Self-Similarity for Video Understanding

1️⃣ 一句话总结

本文提出了一种轻量级的神经网络模块MOSS，能够从视频中提取并整合不同层次的时空自相似性特征，从而以极低的计算成本显著提升动作识别、视频问答和机器人任务等多种视频理解任务的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08317

arXiv 提交日期: 2026-03-09

computer vision model evaluation benchmark action recognition human-ai comparison egocentric vision spatiotemporal analysis robustness evaluation

在空间与时空操作下人机在以自我为中心动作识别中的差异 / Human-AI Divergence in Ego-centric Action Recognition under Spatial and Spatiotemporal Manipulations

1️⃣ 一句话总结

这项研究发现，在识别视频中的动作时，人类主要依赖关键的手-物交互等语义线索，而AI模型则更依赖上下文和中低层视觉特征，导致在图像被裁剪或时间顺序被打乱时，两者的识别表现和策略存在显著差异。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.23118

1️⃣ 一句话总结

arXiv ID: 2606.13332

1️⃣ 一句话总结

arXiv ID: 2605.19578

1️⃣ 一句话总结

arXiv ID: 2604.20760

1️⃣ 一句话总结

arXiv ID: 2603.08317

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.23118 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.13332 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.19578 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.20760 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08317 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.23118

arXiv ID: 2606.13332

arXiv ID: 2605.19578

arXiv ID: 2604.20760

arXiv ID: 2603.08317