📄 论文总结
VoxHammer:无需训练的原生3D空间精确与连贯编辑方法 / VoxHammer: Training-Free Precise and Coherent 3D Editing in Native 3D Space
1️⃣ 一句话总结
这项研究提出了一种无需训练的3D编辑技术VoxHammer,通过在3D潜在空间中直接操作,实现了对指定区域的精确修改,同时完美保留未编辑部分的细节和整体连贯性,显著优于现有方法。
请先 登录 后再提交论文
VoxHammer:无需训练的原生3D空间精确与连贯编辑方法 / VoxHammer: Training-Free Precise and Coherent 3D Editing in Native 3D Space
这项研究提出了一种无需训练的3D编辑技术VoxHammer,通过在3D潜在空间中直接操作,实现了对指定区域的精确修改,同时完美保留未编辑部分的细节和整体连贯性,显著优于现有方法。
预测未来令牌顺序改进语言建模 / Predicting the Order of Upcoming Tokens Improves Language Modeling
这篇论文提出了一种名为令牌顺序预测的新训练方法,通过让模型学习排列未来词汇的顺序而非直接预测具体词汇,在多个标准测试中显著提升了语言模型的性能,且比现有方法更高效。
VibeVoice技术报告 / VibeVoice Technical Report
这篇论文提出了VibeVoice模型,它通过一种创新的连续语音分词器和扩散技术,能够高效合成长达90分钟、最多包含4位说话人的多角色长语音,并真实还原对话氛围,性能优于现有开源和商业模型。
FastMesh:通过组件解耦实现高效艺术化网格生成 / FastMesh: Efficient Artistic Mesh Generation via Component Decoupling
这篇论文提出了一种将顶点和面分离生成的新方法,通过减少重复顶点表达使网格生成速度提升8倍以上,同时生成质量更高。
不遗漏任何标签:适用于所有监督模式的统一表面缺陷检测模型 / No Label Left Behind: A Unified Surface Defect Detection Model for all Supervision Regimes
这篇论文提出了一个名为SuperSimpleNet的高效通用模型,它通过创新的合成异常生成和优化学习流程,首次实现了在无监督、弱监督、混合监督和全监督四种场景下都能高效训练和检测表面缺陷,并在保持高速推理的同时显著提升了检测性能。
USO:通过解耦与奖励学习实现统一风格与主体驱动的生成 / USO: Unified Style and Subject-Driven Generation via Disentangled and Reward Learning
这项研究提出了一个名为USO的统一模型,能够同时保证生成图像在风格上与参考风格图相似、在主体内容上与原始内容图一致,解决了以往方法中风格与主体生成任务相互割裂的问题。
ThinkDial:一种控制大语言模型推理计算量的开放方案 / ThinkDial: An Open Recipe for Controlling Reasoning Effort in Large Language Models
这篇论文提出了一个名为ThinkDial的开放框架,能让大语言模型像切换档位一样在三种推理模式间自由切换,从而在保持性能的同时显著降低计算成本。
混合专家语言模型在推理任务中的最优稀疏性 / Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks
这项研究发现,混合专家模型在推理任务中的性能不仅取决于训练损失,更关键的是激活计算量和每个参数处理的数据量,推理能力需要大量数据支持,而记忆任务则受益于更多参数。
UltraMemV2:扩展到1200亿参数并具备卓越长上下文学习能力的内存网络 / UltraMemV2: Memory Networks Scaling to 120B Parameters with Superior Long-Context Learning
这项研究提出了名为UltraMemV2的新型内存网络架构,通过五项关键技术改进,在保持低内存访问成本的同时,首次实现了与顶尖8专家混合模型相当的性能,并在长文本记忆等任务上表现更优。
从矢量图到CAD:基于序列到序列学习的CAD生成 / Drawing2CAD: Sequence-to-Sequence Learning for CAD Generation from Vector Drawings
这篇论文提出了一种名为Drawing2CAD的新方法,能够将二维工程矢量图自动转换为精确的参数化CAD模型,通过序列到序列学习技术保留了原始设计意图和几何精度。