arXiv最新AI论文速览速学

🔍

标签: #unified model ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: CAWM-Mamba: A unified model for infrared-visible image fusion and compound adverse weather restoration 03-04

arXiv ID: 2603.02560

arXiv 提交日期: 2026-03-03

computer vision multi-modal model training image fusion adverse weather restoration state space models multimodal alignment unified model

CAWM-Mamba：一种用于红外-可见光图像融合与复合恶劣天气恢复的统一模型 / CAWM-Mamba: A unified model for infrared-visible image fusion and compound adverse weather restoration

1️⃣ 一句话总结

这篇论文提出了一个名为CAWM-Mamba的统一AI模型，它能够同时处理红外与可见光图像的融合，并修复多种恶劣天气（如雾、雨、雪）共同造成的图像质量下降问题，从而为自动驾驶等应用在复杂天气下提供更清晰、信息更丰富的视觉感知。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.20306

arXiv 提交日期: 2026-01-28

computer vision model training systems image restoration diffusion models multi-prior guidance unified model degradation removal

TPGDiff：用于图像修复的分层三重先验引导扩散模型 / TPGDiff: Hierarchical Triple-Prior Guided Diffusion for Image Restoration

1️⃣ 一句话总结

这篇论文提出了一个名为TPGDiff的统一图像修复模型，它通过巧妙地将结构、语义和退化三种先验信息分层引入扩散过程，有效解决了现有方法在严重退化区域内容重建上的难题，从而在各种修复场景下都取得了出色的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.03043

arXiv 提交日期: 2025-12-02

multi-modal model training agents visual reasoning multimodal llm reinforcement learning unified model video understanding

OneThinker：面向图像与视频的一体化推理模型 / OneThinker: All-in-one Reasoning Model for Image and Video

1️⃣ 一句话总结

这篇论文提出了一个名为OneThinker的统一模型，它能够同时处理图像和视频的多种核心视觉理解任务（如问答、描述、定位和分割），并通过创新的训练方法解决了多任务学习中的奖励不平衡问题，在多个基准测试上表现出色，向通用的多模态推理专家迈进了一步。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.02560

1️⃣ 一句话总结

arXiv ID: 2601.20306

1️⃣ 一句话总结

arXiv ID: 2512.03043

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.02560 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.20306 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.03043 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.02560

arXiv ID: 2601.20306

arXiv ID: 2512.03043