图像块坍缩 / The Collapse of Patches
1️⃣ 一句话总结
这篇论文提出了一种名为‘图像块坍缩’的新视角,通过分析图像中不同区域之间的相互依赖关系来确定一个最优的观察顺序,从而让计算机在只看到部分图像的情况下就能高效地完成图像生成和识别任务。
请先 登录 后再提交论文
图像块坍缩 / The Collapse of Patches
这篇论文提出了一种名为‘图像块坍缩’的新视角,通过分析图像中不同区域之间的相互依赖关系来确定一个最优的观察顺序,从而让计算机在只看到部分图像的情况下就能高效地完成图像生成和识别任务。
STARFlow-V:基于标准化流的端到端视频生成模型 / STARFlow-V: End-to-End Video Generative Modeling with Normalizing Flows
这篇论文提出了一种名为STARFlow-V的新型视频生成模型,它利用标准化流技术实现了端到端的视频生成,在保证高视觉质量和时间一致性的同时,还能高效处理文本、图像到视频等多种生成任务,为视频生成领域提供了新的研究方向。
ARGenSeg:基于自回归图像生成模型的图像分割方法 / ARGenSeg: Image Segmentation with Autoregressive Image Generation Model
这篇论文提出了一种名为ARGenSeg的新方法,通过将图像分割任务融入多模态大语言模型并采用图像生成方式,实现了更精细的像素级分割,同时大幅提升了推理速度。
循环深度模型的高效并行采样器及其与扩散语言模型的关联 / Efficient Parallel Samplers for Recurrent-Depth Models and Their Connection to Diffusion Language Models
这篇论文提出了一种新的并行采样方法,通过借鉴扩散模型的思想,显著加速了循环深度语言模型的文本生成速度,在无需额外调优的情况下实现了高达5倍的效率提升。
镜像推测解码:打破大语言模型推理中的串行瓶颈 / Mirror Speculative Decoding: Breaking the Serial Barrier in LLM Inference
本文提出了一种名为镜像推测解码的新算法,通过并行异构计算和多令牌推测流技术,在大幅降低大语言模型推理延迟的同时保持高准确率,实现了比现有方法更优的加速效果。
CHARM:基于控制点的三维动漫发型自回归建模 / CHARM: Control-point-based 3D Anime Hairstyle Auto-Regressive Modeling
这篇论文提出了一个名为CHARM的新方法,它使用基于控制点的简洁参数和自回归生成框架来自动创建高质量的三维动漫发型,并建立了一个大型数据集来支持训练和评估。