arXiv ID:
2512.07805
群表示位置编码 / Group Representational Position Encoding
1️⃣ 一句话总结
这篇论文提出了一个名为GRAPE的统一框架,它利用数学中的群作用理论,将RoPE和ALiBi等主流位置编码方法都纳入其中,为设计长文本模型中的位置信息表示提供了一个更通用、更灵活的理论基础。
群表示位置编码 / Group Representational Position Encoding
这篇论文提出了一个名为GRAPE的统一框架,它利用数学中的群作用理论,将RoPE和ALiBi等主流位置编码方法都纳入其中,为设计长文本模型中的位置信息表示提供了一个更通用、更灵活的理论基础。
OneStory:一种具有自适应记忆能力的连贯多镜头视频生成方法 / OneStory: Coherent Multi-Shot Video Generation with Adaptive Memory
这篇论文提出了一种名为OneStory的新方法,它通过构建一个自适应的全局记忆模块来捕捉和整合不同镜头间的语义关联,从而能够生成情节连贯、可控的长篇多镜头叙事视频,解决了现有方法在复杂叙事下连贯性不足的问题。
论预训练、中期训练与强化学习在推理语言模型中的相互作用 / On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models
这项研究通过一个完全受控的实验框架发现,强化学习能否真正提升语言模型的推理能力,关键取决于预训练是否留有提升空间、训练数据是否针对模型能力的边界,并且揭示了中期训练在提升效率方面比单纯强化学习更有效。
分布匹配变分自编码器 / Distribution Matching Variational AutoEncoder
这篇论文提出了一种新的变分自编码器,它通过显式地让编码器输出的特征分布去匹配任意指定的目标分布,从而发现自监督学习得到的特征分布能更好地平衡图像重建质量和生成效率,显著提升了图像生成效果。
LongCat-Image 技术报告 / LongCat-Image Technical Report
这篇论文介绍了一个名为LongCat-Image的开源双语图像生成模型,它在生成图片时能准确渲染中英文字符、效果逼真、运行高效,并提供了完整的训练工具链以支持开发者社区。
超越实数:面向长上下文大语言模型的旋转位置编码虚部扩展 / Beyond Real: Imaginary Extension of Rotary Position Embeddings for Long-Context LLMs
这篇论文提出了一种改进的旋转位置编码方法,通过重新利用之前被丢弃的虚部信息来增强大语言模型对长文本的理解能力,实验证明该方法能有效提升长上下文任务的性能。
基于时序推理器的统一视频编辑 / Unified Video Editing with Temporal Reasoner
这篇论文提出了一种名为VideoCoF的新方法,它通过让AI模型先‘观察并推理’视频中需要编辑的区域,再进行自动编辑,从而无需用户手动标记就能实现精确、统一的视频编辑,并且仅需少量数据进行训练。
原生并行推理器:通过自蒸馏强化学习实现并行推理 / Native Parallel Reasoner: Reasoning in Parallelism via Self-Distilled Reinforcement Learning
这篇论文提出了一个名为NPR的无教师框架,它让大语言模型通过自我进化的方式,从模仿串行思考转变为真正具备并行推理能力,从而在多个任务上显著提升了性能和推理速度。
JEPA作为神经分词器:利用密度自适应注意力学习鲁棒的语音表征 / JEPA as a Neural Tokenizer: Learning Robust Speech Representations with Density Adaptive Attention
这篇论文提出了一种两阶段自监督学习框架,它结合了联合嵌入预测架构和一种密度自适应注意力机制,能够从语音中高效提取出高度压缩、易于语言模型处理且能高质量还原成声音的语义特征单元。
SUCCESS-GS:面向高效静态与动态高斯泼溅的紧凑性与压缩方法综述 / SUCCESS-GS: Survey of Compactness and Compression for Efficient Static and Dynamic Gaussian Splatting
这篇综述论文系统梳理了旨在降低3D高斯泼溅技术内存与计算开销的各种压缩方法,涵盖了静态和动态3D场景,为未来实现更高效、紧凑的实时3D重建指明了方向。
请先 登录 后再提交论文