🤖 系统
12-04 14:24
Qwen3-VL技术报告 / Qwen3-VL Technical Report
1️⃣ 一句话总结
这篇论文介绍了通义千问系列目前最强的多模态大模型Qwen3-VL,它在文本理解、长上下文处理以及图像视频推理方面都表现卓越,并提供了从轻量到超大规模的不同版本,旨在成为现实应用中多模态智能的核心引擎。
请先 登录 后再提交论文
Qwen3-VL技术报告 / Qwen3-VL Technical Report
这篇论文介绍了通义千问系列目前最强的多模态大模型Qwen3-VL,它在文本理解、长上下文处理以及图像视频推理方面都表现卓越,并提供了从轻量到超大规模的不同版本,旨在成为现实应用中多模态智能的核心引擎。
Adamas:用于高效长上下文推理的哈达玛稀疏注意力机制 / Adamas: Hadamard Sparse Attention for Efficient Long-Context Inference
这篇论文提出了一种名为Adamas的新型稀疏注意力方法,它通过哈达玛变换和高效距离估计技术,在保持与完整注意力机制相近准确度的同时,大幅提升了长文本处理的速度和效率。
LongEmotion:衡量大语言模型在长上下文交互中的情感智能 / LongEmotion: Measuring Emotional Intelligence of Large Language Models in Long-Context Interaction
这篇论文提出了一个名为LongEmotion的基准测试,专门用于评估大语言模型在长文本交互中的情感智能表现,并通过引入检索增强生成和协作情感建模方法,有效提升了模型在真实复杂场景下的情感理解与表达能力。