arXiv ID:
2602.07689
视频的思维过程推理 / Process-of-Thought Reasoning for Videos
1️⃣ 一句话总结
这篇论文提出了一个名为‘思维过程’的视频推理框架,它将复杂的视频理解任务分解成一系列可验证的步骤,从而让推理过程更清晰、更准确,并减少错误,同时适用于不同的现有模型。
视频的思维过程推理 / Process-of-Thought Reasoning for Videos
这篇论文提出了一个名为‘思维过程’的视频推理框架,它将复杂的视频理解任务分解成一系列可验证的步骤,从而让推理过程更清晰、更准确,并减少错误,同时适用于不同的现有模型。
连接语音、情感与动作:一种基于视觉语言模型、可部署于边缘的人形机器人多模态交互框架 / Bridging Speech, Emotion, and Motion: a VLM-based Multimodal Edge-deployable Framework for Humanoid Robots
这篇论文提出了一个名为SeM²的智能框架,它能让机器人像人一样,在说话时自然地协调语音、面部表情和身体动作来表达情感,并且这个框架经过优化后可以直接在机器人自带的设备上高效运行,无需依赖云端。
VividFace:面向仿人机器人的实时逼真面部表情模仿系统 / VividFace: Real-Time and Realistic Facial Expression Shadowing for Humanoid Robots
这篇论文提出了一个名为VividFace的系统,它能让仿人机器人以极低的延迟(0.05秒内)实时、逼真地模仿人类的面部表情,从而显著提升机器人的拟人化表现和情感交互能力。
基于强化学习的异构文本用户高保真表征方法 / High Fidelity Textual User Representation over Heterogeneous Sources via Reinforcement Learning
这篇论文提出了一种利用强化学习框架,从用户档案、职业数据和搜索日志等多种文本信息中,自动提炼并合成一个统一、简洁且可解释的用户文本表征的方法,该方法无需人工标注,并能有效提升大型招聘平台推荐系统的业务指标。
论度量空间中的生成问题 / On Generation in Metric Spaces
这篇论文将语言生成的理论框架从可数域推广到可分的度量空间,通过引入一种对尺度敏感的维度概念来刻画生成的可能性,并揭示了一个关键的几何差异:在类似欧氏空间的‘加倍空间’中生成性质是稳定的,但在一般的度量空间(如无限维希尔伯特空间)中,生成性质会随着‘新颖性’参数的微小变化而突然失效。
可视化不可见:通过任务驱动的色彩编码提升放射科医生在乳腺钼靶检查中的表现 / Visualizing the Invisible: Enhancing Radiologist Performance in Breast Mammography via Task-Driven Chromatic Encoding
这项研究开发了一个名为MammoColor的系统,它通过智能色彩编码技术,将传统的黑白乳腺钼靶图像转换成更容易识别的彩色图像,帮助医生更准确地发现致密型乳腺中的可疑病灶,从而减少误判。
多模态序列推荐的增强 / Multimodal Enhancement of Sequential Recommendation
这篇论文提出了一个名为MuSTRec的新推荐系统框架,它通过结合物品的文本和图像信息来构建物品关系图,并利用注意力机制捕捉用户的长短期偏好,从而在多个数据集上显著超越了现有的先进推荐方法。
基于强化学习的无服务器平台上结构化并行Farm骨架的动态管理 / Reinforcement Learning-Based Dynamic Management of Structured Parallel Farm Skeletons on Serverless Platforms
这篇论文提出了一个在无服务器平台上动态管理并行计算框架的方法,通过强化学习自动调整工作节点数量,在保证程序易用性的同时,比传统反应式管理更能适应平台限制,从而提升性能并高效利用资源。
SpectraKAN:条件化谱算子 / SpectraKAN: Conditioning Spectral Operators
这篇论文提出了一种名为SpectraKAN的新型神经网络算子,它能够根据输入数据动态调整其内部的频谱运算,从而更准确地预测复杂物理系统的多尺度动态变化,在多个偏微分方程基准测试中显著超越了现有方法。
Tempora:刻画在线测试时自适应方法的时间依赖性效用 / Tempora: Characterising the Time-Contingent Utility of Online Test-Time Adaptation
这篇论文提出了一个名为Tempora的新框架,用于评估机器学习模型在现实部署中面临时间压力时的自适应能力,揭示了传统性能排名在考虑延迟后会发生变化,帮助开发者和研究者选择更适合实际应用场景的模型自适应方法。
请先 登录 后再提交论文