arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 167 最新: MovieTeller: Tool-augmented Movie Synopsis with ID Consistent Progressive Abstraction 02-27

arXiv ID: 2602.06035

arXiv 提交日期: 2026-02-05

robotics model training agents human-object interaction generative control imitation learning reinforcement learning motion prior

InterPrior：基于物理的人-物交互生成控制的可扩展框架 / InterPrior: Scaling Generative Control for Physics-Based Human-Object Interactions

1️⃣ 一句话总结

这篇论文提出了一个名为InterPrior的可扩展框架，它通过大规模模仿预训练和强化学习微调，学习了一个统一的生成控制器，使类人机器人能够根据高层意图（如物体功能）自然地生成并泛化全身协调的移动与操作技能，即使面对未见过的物体或场景。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.06000

arXiv 提交日期: 2026-02-05

audio natural language processing model evaluation speech emotion recognition attention pooling whisper model multilingual representation learning

利用OpenAI Whisper表征与注意力池化方法进行语音情感识别 / Speech Emotion Recognition Leveraging OpenAI's Whisper Representations and Attentive Pooling Methods

1️⃣ 一句话总结

这篇论文提出了一种利用OpenAI的Whisper语音识别模型来提取语音情感特征，并结合两种新型的注意力池化方法，在英语和波斯语数据集上实现了高效且高性能的情感识别，为轻量级语音情感分析提供了新方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05480

arXiv 提交日期: 2026-02-05

computer vision multi-modal data remote sensing image alignment sar-optical dataset multi-task learning

SOMA-1M：一个用于多任务遥感的大规模合成孔径雷达-光学多分辨率对齐数据集 / SOMA-1M: A Large-Scale SAR-Optical Multi-resolution Alignment Dataset for Multi-Task Remote Sensing

1️⃣ 一句话总结

这篇论文发布了一个包含超过130万对精确对齐的合成孔径雷达与光学遥感图像的大型数据集，旨在解决现有数据在规模、分辨率和对齐精度上的不足，并通过实验证明该数据集能显著提升多种跨模态遥感视觉任务的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05544

arXiv 提交日期: 2026-02-05

llm natural language processing model evaluation explainable recommendation collaborative filtering sequential recommendation reasoning cold-start

基于推理引导协同过滤与语言模型的可解释推荐系统 / Reasoning-guided Collaborative Filtering with Language Models for Explainable Recommendation

1️⃣ 一句话总结

这篇论文提出了一个名为RGCF-XRec的新框架，它巧妙地将传统推荐系统的协同过滤能力与大语言模型的推理解释能力结合起来，一步到位地生成既准确又易于理解的个性化推荐理由，并在多个数据集上显著提升了推荐效果和解释质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05690

arXiv 提交日期: 2026-02-05

theory machine learning model evaluation active clustering pairwise queries bandit feedback asymptotic optimality change-of-measure

基于成对观测的几乎渐进最优主动聚类 / Almost Asymptotically Optimal Active Clustering Through Pairwise Observations

1️⃣ 一句话总结

这篇论文提出了一种新的主动学习框架，通过智能地询问物品之间的相似性来高效地对它们进行分组，并设计了一个在理论上接近最优效率的算法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05184

arXiv 提交日期: 2026-02-05

theory model evaluation machine learning interpretability renormalization robustness statistical physics multi-scale analysis

迈向具有最坏情况保证与尺度感知可解释性 / Towards Worst-Case Guarantees with Scale-Aware Interpretability

1️⃣ 一句话总结

这篇论文提出了一种名为‘尺度感知可解释性’的新研究框架，旨在借鉴物理学中的重正化理论，开发出能够追踪神经网络在不同尺度上如何组合特征、并保证对噪声影响的可靠解释工具，以提升AI模型的可解释性与安全性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05238

arXiv 提交日期: 2026-02-05

computer vision model training machine learning anomaly detection normalizing flow surface defect industrial inspection feature adaptation

PatchFlow：利用基于流的模型与局部特征进行异常检测 / PatchFlow: Leveraging a Flow-Based Model with Patch Features

1️⃣ 一句话总结

这篇论文提出了一种名为PatchFlow的新方法，它通过结合局部图像块特征和流模型，并引入适配器模块，有效提升了工业产品（如压铸件）表面缺陷的自动检测精度，且无需异常样本进行训练。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05423

arXiv 提交日期: 2026-02-05

computer vision multi-modal model training 3d reconstruction neural radiance fields novel view synthesis depth estimation bundle adjustment

NeVStereo：一种用于高保真3D任务的NeRF驱动的新视角合成-立体视觉架构 / NeVStereo: A NeRF-Driven NVS-Stereo Architecture for High-Fidelity 3D Tasks

1️⃣ 一句话总结

这篇论文提出了一个名为NeVStereo的新框架，它巧妙地将神经渲染和立体视觉技术结合起来，只用普通拍摄的彩色照片，就能同时高精度地计算出相机位置、深度图、生成新视角画面并重建出高质量的3D模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05416

arXiv 提交日期: 2026-02-05

systems model training model evaluation koopman autoencoder surrogate modeling coastal-ocean modeling reduced-order models temporal stability

用于受迫柔性网格海岸-海洋模型的降阶代理模型 / Reduced-Order Surrogates for Forced Flexible Mesh Coastal-Ocean Models

1️⃣ 一句话总结

这篇论文提出了一种结合气象强迫和边界条件的Koopman自编码器方法，用于快速模拟海岸海洋动力学，相比传统方法，它在保持厘米级精度误差的同时，将计算速度提升了数百到上千倍，从而使得长期气候模拟和集合预报等应用变得可行。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05588

arXiv 提交日期: 2026-02-05

medical systems multi-modal mixed reality medical training augmented reality surgical simulation haptic feedback

用于分娩训练中稳健人体模型定位的混合现实系统 / A Mixed Reality System for Robust Manikin Localization in Childbirth Training

1️⃣ 一句话总结

这项研究开发了一套混合现实分娩训练系统，它通过外部摄像头和算法精准定位物理人体模型，让医学生能在没有专家全程监督的情况下，结合虚拟指导和真实触感进行独立练习，显著提升了训练效果和学员偏好。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.06035

1️⃣ 一句话总结

arXiv ID: 2602.06000

1️⃣ 一句话总结

arXiv ID: 2602.05480

1️⃣ 一句话总结

arXiv ID: 2602.05544

1️⃣ 一句话总结

arXiv ID: 2602.05690

1️⃣ 一句话总结

arXiv ID: 2602.05184

1️⃣ 一句话总结

arXiv ID: 2602.05238

1️⃣ 一句话总结

arXiv ID: 2602.05423

1️⃣ 一句话总结

arXiv ID: 2602.05416

1️⃣ 一句话总结

arXiv ID: 2602.05588

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.06035 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.06000 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05480 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05544 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05690 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05184 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05238 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05423 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05416 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05588 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.06035

arXiv ID: 2602.06000

arXiv ID: 2602.05480

arXiv ID: 2602.05544

arXiv ID: 2602.05690

arXiv ID: 2602.05184

arXiv ID: 2602.05238

arXiv ID: 2602.05423

arXiv ID: 2602.05416

arXiv ID: 2602.05588