arXiv ID:
2508.19026
MovieCORE:电影中的认知推理 / MovieCORE: COgnitive REasoning in Movies
1️⃣ 一句话总结
这篇论文提出了一个名为MovieCORE的新型视频问答数据集,专门用于测试AI对电影内容深层认知理解的能力,并通过创新的智能增强方法显著提升了现有模型的推理表现。
MovieCORE:电影中的认知推理 / MovieCORE: COgnitive REasoning in Movies
这篇论文提出了一个名为MovieCORE的新型视频问答数据集,专门用于测试AI对电影内容深层认知理解的能力,并通过创新的智能增强方法显著提升了现有模型的推理表现。
USO:通过解耦与奖励学习实现统一风格与主体驱动的生成 / USO: Unified Style and Subject-Driven Generation via Disentangled and Reward Learning
这项研究提出了一个名为USO的统一模型,能够同时保证生成图像在风格上与参考风格图相似、在主体内容上与原始内容图一致,解决了以往方法中风格与主体生成任务相互割裂的问题。
ThinkDial:一种控制大语言模型推理计算量的开放方案 / ThinkDial: An Open Recipe for Controlling Reasoning Effort in Large Language Models
这篇论文提出了一个名为ThinkDial的开放框架,能让大语言模型像切换档位一样在三种推理模式间自由切换,从而在保持性能的同时显著降低计算成本。
UltraMemV2:扩展到1200亿参数并具备卓越长上下文学习能力的内存网络 / UltraMemV2: Memory Networks Scaling to 120B Parameters with Superior Long-Context Learning
这项研究提出了名为UltraMemV2的新型内存网络架构,通过五项关键技术改进,在保持低内存访问成本的同时,首次实现了与顶尖8专家混合模型相当的性能,并在长文本记忆等任务上表现更优。
从矢量图到CAD:基于序列到序列学习的CAD生成 / Drawing2CAD: Sequence-to-Sequence Learning for CAD Generation from Vector Drawings
这篇论文提出了一种名为Drawing2CAD的新方法,能够将二维工程矢量图自动转换为精确的参数化CAD模型,通过序列到序列学习技术保留了原始设计意图和几何精度。
混合专家语言模型在推理任务中的最优稀疏性 / Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks
这项研究发现,混合专家模型在推理任务中的性能不仅取决于训练损失,更关键的是激活计算量和每个参数处理的数据量,推理能力需要大量数据支持,而记忆任务则受益于更多参数。
ROSE:消除视频中物体的附带效应 / ROSE: Remove Objects with Side Effects in Videos
这篇论文提出了一个名为ROSE的视频对象移除框架,它不仅能够去除物体本身,还能有效消除物体在环境中产生的阴影、反光等五种常见附带效应,通过合成数据和专门设计的模型在多种场景下实现了优于现有方法的性能。
万-S2V:音频驱动的影视视频生成 / Wan-S2V: Audio-Driven Cinematic Video Generation
这篇论文提出了一种名为Wan-S2V的音频驱动视频生成模型,它能够根据音频创造出包含细腻角色互动、自然身体动作和动态镜头的高质量影视级视频,在表现力和真实感上显著优于现有技术。
利用CTF-Dojo训练语言模型代理发现漏洞 / Training Language Model Agents to Find Vulnerabilities with CTF-Dojo
这篇论文提出了一个名为CTF-Dojo的大规模可执行训练平台,通过自动生成网络安全挑战环境来高效训练语言模型代理,仅用少量高质量数据就显著提升了模型在多个基准测试中的表现,达到了与顶尖模型相媲美的水平。
ObjFiller-3D:通过视频扩散模型实现一致的多视角三维修复 / ObjFiller-3D: Consistent Multi-view 3D Inpainting via Video Diffusion Models
这篇论文提出了一种名为ObjFiller-3D的新方法,它通过巧妙利用先进的视频编辑模型来修复三维物体,解决了传统方法中多视角修复不一致的问题,从而实现了更高质量、更连贯的三维物体补全与编辑。
请先 登录 后再提交论文