arXiv最新AI论文速览速学

🔍

标签: #multitask learning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: Ultra-Peripheral Collisions as a Nuclear-Structure Interferometer with Interpretable Multitask Deep Learning 06-23

arXiv ID: 2606.23353

arXiv 提交日期: 2026-06-22

machine learning physics multitask learning ultra-peripheral collisions nuclear structure interpretable deep learning

超外围碰撞作为核结构干涉仪：基于可解释多任务深度学习的方法 / Ultra-Peripheral Collisions as a Nuclear-Structure Interferometer with Interpretable Multitask Deep Learning

1️⃣ 一句话总结

该研究提出了一种可解释的多任务深度学习框架，通过分析原子核在超外围碰撞中产生的粒子衍射和干涉图案，同时提取多个核结构参数（如形变和中子皮厚度），从而实现对原子核内部结构的精准成像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22522

arXiv 提交日期: 2026-02-26

audio natural language processing model training speech recognition low-resource language dialect modeling multitask learning rnn transducer

面向低资源台湾客家语语音处理的高效方言感知建模与条件化方法 / Efficient Dialect-Aware Modeling and Conditioning for Low-Resource Taiwanese Hakka Speech Processing

1️⃣ 一句话总结

这项研究提出了一种新的方言感知语音识别框架，能有效分离台湾客家语中的方言特征与语言内容，并首次用一个模型同时处理汉字和拼音两种书写系统，显著提升了低资源濒危语言的识别准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16256

arXiv 提交日期: 2026-02-18

audio machine learning natural language processing speech emotion recognition color representation multitask learning regression models crowdsourcing annotation

基于颜色的情感表征在语音情感识别中的应用 / Color-based Emotion Representation for Speech Emotion Recognition

1️⃣ 一句话总结

这篇论文提出了一种用颜色属性（如色调、饱和度、明度）来连续、直观地表示语音情感的新方法，并通过构建回归模型和多任务学习，证明了该方法能有效提升语音情感识别的性能和可解释性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.04151

arXiv 提交日期: 2026-01-07

multi-modal aigc model training audio-video generation diffusion transformers multitask learning dataset curation attention mechanisms

Klear：统一的多任务音视频联合生成 / Klear: Unified Multi-Task Audio-Video Joint Generation

1️⃣ 一句话总结

这篇论文提出了一个名为Klear的统一模型，通过创新的架构设计、训练策略和高质量数据集构建，解决了音视频生成中常见的不同步、口型不匹配等问题，能够高质量地生成同步且符合指令的音视频内容。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.24992

arXiv 提交日期: 2025-10-28

audio natural language processing model training speech processing phonetic tasks unified framework multitask learning low-resource speech

POWSM：一个语音开放耳语式语音基础模型 / POWSM: A Phonetic Open Whisper-Style Speech Foundation Model

1️⃣ 一句话总结

这篇论文提出了一个名为POWSM的统一语音处理模型，能够同时完成语音识别、音素转换等多种语音相关任务，性能媲美专用模型，并支持开放科学共享。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.23353

1️⃣ 一句话总结

arXiv ID: 2602.22522

1️⃣ 一句话总结

arXiv ID: 2602.16256

1️⃣ 一句话总结

arXiv ID: 2601.04151

1️⃣ 一句话总结

arXiv ID: 2510.24992

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.23353 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22522 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16256 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.04151 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.24992 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.23353

arXiv ID: 2602.22522

arXiv ID: 2602.16256

arXiv ID: 2601.04151

arXiv ID: 2510.24992