arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 34 72小时内新更新论文 72h更新 84 最新: FlowPrefill: Decoupling Preemption from Prefill Scheduling Granularity to Mitigate Head-of-Line Blocking in LLM Serving 02-22

arXiv ID: 2508.18672

arXiv 提交日期: 2025-08-26

llm model training machine learning mixture-of-experts scaling laws reasoning sparsity compute optimization

混合专家语言模型在推理任务中的最优稀疏性 / Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks

1️⃣ 一句话总结

这项研究发现，混合专家模型在推理任务中的性能不仅取决于训练损失，更关键的是激活计算量和每个参数处理的数据量，推理能力需要大量数据支持，而记忆任务则受益于更多参数。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.18633

arXiv 提交日期: 2025-08-26

computer vision video generation model training video object removal side effects video inpainting synthetic data diffusion transformer

ROSE：消除视频中物体的附带效应 / ROSE: Remove Objects with Side Effects in Videos

1️⃣ 一句话总结

这篇论文提出了一个名为ROSE的视频对象移除框架，它不仅能够去除物体本身，还能有效消除物体在环境中产生的阴影、反光等五种常见附带效应，通过合成数据和专门设计的模型在多种场景下实现了优于现有方法的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.18621

arXiv 提交日期: 2025-08-26

video generation aigc audio character animation audio-driven cinematic video lip-sync video editing

万-S2V：音频驱动的影视视频生成 / Wan-S2V: Audio-Driven Cinematic Video Generation

1️⃣ 一句话总结

这篇论文提出了一种名为Wan-S2V的音频驱动视频生成模型，它能够根据音频创造出包含细腻角色互动、自然身体动作和动态镜头的高质量影视级视频，在表现力和真实感上显著优于现有技术。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.18370

arXiv 提交日期: 2025-08-25

llm agents systems capture the flag cybersecurity execution environments automated training verifiable feedback

利用CTF-Dojo训练语言模型代理发现漏洞 / Training Language Model Agents to Find Vulnerabilities with CTF-Dojo

1️⃣ 一句话总结

这篇论文提出了一个名为CTF-Dojo的大规模可执行训练平台，通过自动生成网络安全挑战环境来高效训练语言模型代理，仅用少量高质量数据就显著提升了模型在多个基准测试中的表现，达到了与顶尖模型相媲美的水平。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.18271

arXiv 提交日期: 2025-08-25

computer vision video generation model training 3d inpainting video diffusion multi-view consistency 3d reconstruction neural rendering

ObjFiller-3D：通过视频扩散模型实现一致的多视角三维修复 / ObjFiller-3D: Consistent Multi-view 3D Inpainting via Video Diffusion Models

1️⃣ 一句话总结

这篇论文提出了一种名为ObjFiller-3D的新方法，它通过巧妙利用先进的视频编辑模型来修复三维物体，解决了传统方法中多视角修复不一致的问题，从而实现了更高质量、更连贯的三维物体补全与编辑。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.18265

arXiv 提交日期: 2025-08-25

multi-modal model training systems multimodal reasoning reinforcement learning efficiency optimization visual resolution gui interaction

InternVL3.5：在通用性、推理能力和效率上推进开源多模态模型 / InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency

1️⃣ 一句话总结

这篇论文提出了InternVL 3.5开源多模态模型，通过创新的两阶段强化学习框架和动态视觉分辨率调节技术，显著提升了模型的推理能力、运行效率及通用性，并在多项任务中接近顶尖商业模型的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.18192

arXiv 提交日期: 2025-08-25

llm theory model evaluation module communities cognitive patterns network analysis model interpretability fine-tuning strategies

通过模块社群揭示大型语言模型的认知模式 / Unraveling the cognitive patterns of Large Language Models through module communities

1️⃣ 一句话总结

这项研究通过构建一个网络分析框架，发现大型语言模型内部存在独特的模块社群，其技能获取模式类似于鸟类和小型哺乳动物大脑的分布式认知结构，并指出有效的模型优化应利用动态跨区域交互而非固定模块干预。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.18106

arXiv 提交日期: 2025-08-25

llm benchmark model evaluation code generation security evaluation software engineering repository-level testing ai-generated code

A.S.E：一个用于评估AI生成代码安全性的仓库级基准 / A.S.E: A Repository-Level Benchmark for Evaluating Security in AI-Generated Code

1️⃣ 一句话总结

这篇论文提出了一个名为A.S.E的仓库级基准测试，用于评估AI生成代码的安全性，发现当前大语言模型在真实编程场景中仍难以生成安全代码，且代码复杂度增加时模型表现会下降。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.18032

arXiv 提交日期: 2025-08-25

natural language processing model training reinforcement learning text-to-image generation reinforcement learning chain of guidance stage-aware rewards visual reasoning

Visual-CoG：基于阶段感知强化学习与引导链的文生图生成方法 / Visual-CoG: Stage-Aware Reinforcement Learning with Chain of Guidance for Text-to-Image Generation

1️⃣ 一句话总结

本文提出了一种名为Visual-CoG的新方法，通过分阶段奖励机制强化文生图模型对复杂文本的理解能力，显著提升了多属性和模糊提示下的图像生成质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2508.17677

arXiv 提交日期: 2025-08-25

model training llm machine learning data mixture pre-training influence maximization dynamic optimization group influence

TiKMiX：将数据影响力引入语言模型预训练的动态混合策略 / TiKMiX: Take Data Influence into Dynamic Mixture for Language Model Pre-training

1️⃣ 一句话总结

这篇论文提出了一种名为TiKMiX的动态数据混合方法，通过实时评估不同数据领域对模型训练的影响并调整数据配比，显著提升了语言模型的性能，同时大幅降低了计算资源消耗。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2508.18672

1️⃣ 一句话总结

arXiv ID: 2508.18633

1️⃣ 一句话总结

arXiv ID: 2508.18621

1️⃣ 一句话总结

arXiv ID: 2508.18370

1️⃣ 一句话总结

arXiv ID: 2508.18271

1️⃣ 一句话总结

arXiv ID: 2508.18265

1️⃣ 一句话总结

arXiv ID: 2508.18192

1️⃣ 一句话总结

arXiv ID: 2508.18106

1️⃣ 一句话总结

arXiv ID: 2508.18032

1️⃣ 一句话总结

arXiv ID: 2508.17677

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2508.18672 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.18633 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.18621 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.18370 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.18271 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.18265 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.18192 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.18106 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.18032 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2508.17677 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2508.18672

arXiv ID: 2508.18633

arXiv ID: 2508.18621

arXiv ID: 2508.18370

arXiv ID: 2508.18271

arXiv ID: 2508.18265

arXiv ID: 2508.18192

arXiv ID: 2508.18106

arXiv ID: 2508.18032

arXiv ID: 2508.17677