📄 论文总结
TiDAR:扩散思考,自回归对话 / TiDAR: Think in Diffusion, Talk in Autoregression
1️⃣ 一句话总结
这篇论文提出了一种名为TiDAR的新型语言模型架构,它通过在单个前向传播中结合扩散模型的并行生成能力和自回归模型的高质量输出,首次实现了与自回归模型相当的质量,同时将生成速度提升了4.71到5.91倍。
请先 登录 后再提交论文
TiDAR:扩散思考,自回归对话 / TiDAR: Think in Diffusion, Talk in Autoregression
这篇论文提出了一种名为TiDAR的新型语言模型架构,它通过在单个前向传播中结合扩散模型的并行生成能力和自回归模型的高质量输出,首次实现了与自回归模型相当的质量,同时将生成速度提升了4.71到5.91倍。
扩散语言模型是超级数据学习者 / Diffusion Language Models are Super Data Learners
这项研究发现,在数据有限的情况下,扩散语言模型通过多轮训练能持续超越自回归模型,这得益于其任意顺序建模、密集计算和内置数据增强能力,即使在小规模数据上也能取得优异的下游任务表现。
基于离散噪声反演的下一代自回归文本图像编辑方法 / Discrete Noise Inversion for Next-scale Autoregressive Text-based Image Editing
本文提出了一种名为VARIN的创新图像编辑技术,它通过逆向生成特定噪声,让自回归视觉模型能够仅根据文字提示精确修改图片内容,同时完美保留原始背景和结构细节,无需额外训练即可实现高效编辑。
基于代码生成模型的高效代码嵌入方法 / Efficient Code Embeddings from Code Generation Models
这篇论文提出了一种名为jina-code-embeddings的新型代码嵌入模型,它通过创新的方式利用预训练的文本和代码生成模型来创建代码向量,能够在代码检索、技术问答和跨语言代码相似性识别等任务中实现领先性能,且模型规模相对较小。
自回归通用视频分割模型 / Autoregressive Universal Video Segmentation Model
这篇论文提出了一个名为AUSM的统一模型,它能够同时处理有提示和无提示的视频分割任务,通过将视频分割视为序列掩码预测问题,实现了高效、可扩展且训练速度更快的通用视频分割解决方案。
FastMesh:通过组件解耦实现高效艺术化网格生成 / FastMesh: Efficient Artistic Mesh Generation via Component Decoupling
这篇论文提出了一种将顶点和面分离生成的新方法,通过减少重复顶点表达使网格生成速度提升8倍以上,同时生成质量更高。