arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 167 最新: MovieTeller: Tool-augmented Movie Synopsis with ID Consistent Progressive Abstraction 02-27

arXiv ID: 2602.07689

arXiv 提交日期: 2026-02-07

multi-modal video model evaluation video reasoning process-of-thought temporal grounding interpretability vision-language models

视频的思维过程推理 / Process-of-Thought Reasoning for Videos

1️⃣ 一句话总结

这篇论文提出了一个名为‘思维过程’的视频推理框架，它将复杂的视频理解任务分解成一系列可验证的步骤，从而让推理过程更清晰、更准确，并减少错误，同时适用于不同的现有模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07434

arXiv 提交日期: 2026-02-07

robotics multi-modal agents human-robot interaction vision language model edge computing emotional coherence multimodal coordination

连接语音、情感与动作：一种基于视觉语言模型、可部署于边缘的人形机器人多模态交互框架 / Bridging Speech, Emotion, and Motion: a VLM-based Multimodal Edge-deployable Framework for Humanoid Robots

1️⃣ 一句话总结

这篇论文提出了一个名为SeM²的智能框架，它能让机器人像人一样，在说话时自然地协调语音、面部表情和身体动作来表达情感，并且这个框架经过优化后可以直接在机器人自带的设备上高效运行，无需依赖云端。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07506

arXiv 提交日期: 2026-02-07

robotics computer vision multi-modal facial expression imitation real-time system human-robot interaction motion transfer feature adaptation

VividFace：面向仿人机器人的实时逼真面部表情模仿系统 / VividFace: Real-Time and Realistic Facial Expression Shadowing for Humanoid Robots

1️⃣ 一句话总结

这篇论文提出了一个名为VividFace的系统，它能让仿人机器人以极低的延迟（0.05秒内）实时、逼真地模仿人类的面部表情，从而显著提升机器人的拟人化表现和情感交互能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07333

arXiv 提交日期: 2026-02-07

llm reinforcement learning natural language processing user representation personalization recommender systems text distillation latency-sensitive

基于强化学习的异构文本用户高保真表征方法 / High Fidelity Textual User Representation over Heterogeneous Sources via Reinforcement Learning

1️⃣ 一句话总结

这篇论文提出了一种利用强化学习框架，从用户档案、职业数据和搜索日志等多种文本信息中，自动提炼并合成一个统一、简洁且可解释的用户文本表征的方法，该方法无需人工标注，并能有效提升大型招聘平台推荐系统的业务指标。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07710

arXiv 提交日期: 2026-02-07

theory machine learning generation theory metric spaces novelty closure dimension doubling spaces

论度量空间中的生成问题 / On Generation in Metric Spaces

1️⃣ 一句话总结

这篇论文将语言生成的理论框架从可数域推广到可分的度量空间，通过引入一种对尺度敏感的维度概念来刻画生成的可能性，并揭示了一个关键的几何差异：在类似欧氏空间的‘加倍空间’中生成性质是稳定的，但在一般的度量空间（如无限维希尔伯特空间）中，生成性质会随着‘新颖性’参数的微小变化而突然失效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07568

arXiv 提交日期: 2026-02-07

medical computer vision model evaluation medical imaging mammography image enhancement clinical evaluation perceptual salience

可视化不可见：通过任务驱动的色彩编码提升放射科医生在乳腺钼靶检查中的表现 / Visualizing the Invisible: Enhancing Radiologist Performance in Breast Mammography via Task-Driven Chromatic Encoding

1️⃣ 一句话总结

这项研究开发了一个名为MammoColor的系统，它通过智能色彩编码技术，将传统的黑白乳腺钼靶图像转换成更容易识别的彩色图像，帮助医生更准确地发现致密型乳腺中的可疑病灶，从而减少误判。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07207

arXiv 提交日期: 2026-02-06

multi-modal model training systems sequential recommendation multimodal transformer item-item graphs self-attention collaborative filtering

多模态序列推荐的增强 / Multimodal Enhancement of Sequential Recommendation

1️⃣ 一句话总结

这篇论文提出了一个名为MuSTRec的新推荐系统框架，它通过结合物品的文本和图像信息来构建物品关系图，并利用注意力机制捕捉用户的长短期偏好，从而在多个数据集上显著超越了现有的先进推荐方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.06555

arXiv 提交日期: 2026-02-06

systems reinforcement learning agents serverless computing parallel skeletons autoscaling resource management performance optimization

基于强化学习的无服务器平台上结构化并行Farm骨架的动态管理 / Reinforcement Learning-Based Dynamic Management of Structured Parallel Farm Skeletons on Serverless Platforms

1️⃣ 一句话总结

这篇论文提出了一个在无服务器平台上动态管理并行计算框架的方法，通过强化学习自动调整工作节点数量，在保证程序易用性的同时，比传统反应式管理更能适应平台限制，从而提升性能并高效利用资源。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05187

arXiv 提交日期: 2026-02-05

machine learning theory model training neural operators partial differential equations spectral methods fourier neural operator adaptive kernels

SpectraKAN：条件化谱算子 / SpectraKAN: Conditioning Spectral Operators

1️⃣ 一句话总结

这篇论文提出了一种名为SpectraKAN的新型神经网络算子，它能够根据输入数据动态调整其内部的频谱运算，从而更准确地预测复杂物理系统的多尺度动态变化，在多个偏微分方程基准测试中显著超越了现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.06136

arXiv 提交日期: 2026-02-05

model evaluation machine learning systems test-time adaptation latency-accuracy trade-off online adaptation evaluation framework temporal utility

Tempora：刻画在线测试时自适应方法的时间依赖性效用 / Tempora: Characterising the Time-Contingent Utility of Online Test-Time Adaptation

1️⃣ 一句话总结

这篇论文提出了一个名为Tempora的新框架，用于评估机器学习模型在现实部署中面临时间压力时的自适应能力，揭示了传统性能排名在考虑延迟后会发生变化，帮助开发者和研究者选择更适合实际应用场景的模型自适应方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.07689

1️⃣ 一句话总结

arXiv ID: 2602.07434

1️⃣ 一句话总结

arXiv ID: 2602.07506

1️⃣ 一句话总结

arXiv ID: 2602.07333

1️⃣ 一句话总结

arXiv ID: 2602.07710

1️⃣ 一句话总结

arXiv ID: 2602.07568

1️⃣ 一句话总结

arXiv ID: 2602.07207

1️⃣ 一句话总结

arXiv ID: 2602.06555

1️⃣ 一句话总结

arXiv ID: 2602.05187

1️⃣ 一句话总结

arXiv ID: 2602.06136

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.07689 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07434 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07506 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07333 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07710 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07568 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07207 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.06555 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05187 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.06136 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.07689

arXiv ID: 2602.07434

arXiv ID: 2602.07506

arXiv ID: 2602.07333

arXiv ID: 2602.07710

arXiv ID: 2602.07568

arXiv ID: 2602.07207

arXiv ID: 2602.06555

arXiv ID: 2602.05187

arXiv ID: 2602.06136