arXiv最新AI论文速览速学

🔍

model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 174 最新: Describe-Then-Act: Proactive Agent Steering via Distilled Language-Action World Models 03-25

arXiv ID: 2603.03251

arXiv 提交日期: 2026-03-03

llm model training systems speculative decoding inference acceleration parallel verification autoregressive models optimization

推测式推测解码 / Speculative Speculative Decoding

1️⃣ 一句话总结

这篇论文提出了一种名为‘推测式推测解码’的新方法，通过让模型在验证当前预测的同时，提前准备多种可能的后续预测，从而进一步并行化推理过程，将大语言模型的生成速度在现有加速技术基础上再提升最多2倍。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02882

arXiv 提交日期: 2026-03-03

aigc video generation model training invisible watermarking video diffusion blind extraction causal 3d vae robustness

SIGMark：一种用于视频扩散模型的、支持盲提取的可扩展生成中水印技术 / SIGMark: Scalable In-Generation Watermark with Blind Extraction for Video Diffusion

1️⃣ 一句话总结

这篇论文提出了一种名为SIGMark的新方法，它能在AI生成视频的过程中直接嵌入看不见的水印，并且无需存储大量密钥就能高效地检测出来，同时还能有效抵抗视频在时间和空间上的修改，解决了现有技术成本高、不抗干扰的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02599

arXiv 提交日期: 2026-03-03

systems llm model training multi-model serving resource efficiency model disaggregation inference optimization quantization

SUN：共享下一词预测以实现高效的多LLM解耦服务 / SUN: Shared Use of Next-token Prediction for Efficient Multi-LLM Disaggregated Serving

1️⃣ 一句话总结

这篇论文提出了一种名为SUN的新方法，通过将大语言模型的解码部分冻结并共享给多个模型使用，显著提升了多模型同时服务时的GPU利用率和系统吞吐量，同时保持了模型的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03226

arXiv 提交日期: 2026-03-03

machine learning theory model training differential privacy optimization stochastic differential equations adaptive methods privacy-utility trade-off

在高隐私设置下自适应方法更优：一个随机微分方程的视角 / Adaptive Methods Are Preferable in High Privacy Settings: An SDE Perspective

1️⃣ 一句话总结

这篇论文通过随机微分方程分析发现，在严格的差分隐私训练中，自适应优化方法（如DP-SignSGD、DP-Adam）因其超参数对隐私级别不敏感而比传统方法（如DP-SGD）更实用，尤其在隐私要求高或噪声大的场景下表现更优。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02943

arXiv 提交日期: 2026-03-03

model training aigc multi-modal diffusion models sampling acceleration feature caching pade approximation image generation

TC-Padé：用于扩散加速的轨迹一致性帕德逼近 / TC-Padé: Trajectory-Consistent Padé Approximation for Diffusion Acceleration

1️⃣ 一句话总结

这篇论文提出了一种名为TC-Padé的新方法，它通过更精确的数学逼近和自适应策略来加速扩散模型的图像和视频生成过程，在减少计算步骤的同时保持高质量输出，显著超越了现有的加速技术。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02939

arXiv 提交日期: 2026-03-03

llm agents model training trajectory prediction reinforcement fine-tuning group relative policy optimization maritime navigation chain-of-thought reasoning

ShipTraj-R1：通过组相对策略优化强化大语言模型中的船舶轨迹预测 / ShipTraj-R1: Reinforcing Ship Trajectory Prediction in Large Language Models via Group Relative Policy Optimization

1️⃣ 一句话总结

这篇论文提出了一个名为ShipTraj-R1的新框架，它首次将大语言模型应用于船舶轨迹预测，通过创新的动态提示和奖励机制，使其在复杂真实场景下的预测精度超过了现有先进方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02639

arXiv 提交日期: 2026-03-03

machine learning systems model training federated learning stochastic optimization distributed systems gradient delay convergence analysis

凸与非凸联邦学习中陈旧随机梯度的处理：递减步长是唯一所需 / Convex and Non-convex Federated Learning with Stale Stochastic Gradients: Diminishing Step Size is All You Need

1️⃣ 一句话总结

这篇论文证明，在分布式联邦学习场景中，当各参与方的梯度信息可能存在延迟、偏差或陈旧时，使用预先设定好的递减步长策略，就能达到与复杂自适应步长方法相同的优化效果，并且适用于非凸和强凸目标函数。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02511

arXiv 提交日期: 2026-03-03

robotics systems model training object-centric reasoning sequential manipulation cluttered environments spatial relationship encoder imitation learning

面向杂乱环境中序列化操作的物体中心空间推理学习 / Learning Object-Centric Spatial Reasoning for Sequential Manipulation in Cluttered Environments

1️⃣ 一句话总结

这篇论文提出了一个名为Unveiler的机器人操作框架，它将复杂的空间推理与具体动作执行分离开来，通过一个轻量级的决策模块智能地识别并移除遮挡物，从而让机器人能更高效、更成功地从极度杂乱的环境中取出目标物体。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02582

arXiv 提交日期: 2026-03-03

computer vision systems model training inverse problem digital twin material reconstruction neural fields physics-guided learning

用于高分辨率材料参数重建的神经电磁场 / Neural Electromagnetic Fields for High-Resolution Material Parameter Reconstruction

1️⃣ 一句话总结

这篇论文提出了一种名为NEMF的新方法，它能够仅通过非接触式的图像和射频信号，就能为真实场景构建出不仅外观逼真、还能进行物理仿真的‘功能数字孪生体’，其核心在于巧妙地分离并解决了场景几何、环境场和材料属性这三个纠缠在一起的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02743

arXiv 提交日期: 2026-03-03

computer vision multi-modal model training shadow generation diffusion models image compositing multi-object dataset augmentation

CoShadow：基于扩散模型的多物体阴影生成用于图像合成 / CoShadow: Multi-Object Shadow Generation for Image Compositing via Diffusion Model

1️⃣ 一句话总结

这篇论文提出了一种名为CoShadow的新方法，利用预训练的扩散模型为图像合成中同时插入的多个前景物体生成物理上合理且相互协调的阴影，解决了现有方法主要针对单物体且难以推广到多物体场景的局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.03251

1️⃣ 一句话总结

arXiv ID: 2603.02882

1️⃣ 一句话总结

arXiv ID: 2603.02599

1️⃣ 一句话总结

arXiv ID: 2603.03226

1️⃣ 一句话总结

arXiv ID: 2603.02943

1️⃣ 一句话总结

arXiv ID: 2603.02939

1️⃣ 一句话总结

arXiv ID: 2603.02639

1️⃣ 一句话总结

arXiv ID: 2603.02511

1️⃣ 一句话总结

arXiv ID: 2603.02582

1️⃣ 一句话总结

arXiv ID: 2603.02743

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.03251 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02882 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02599 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03226 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02943 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02939 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02639 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02511 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02582 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02743 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.03251

arXiv ID: 2603.02882

arXiv ID: 2603.02599

arXiv ID: 2603.03226

arXiv ID: 2603.02943

arXiv ID: 2603.02939

arXiv ID: 2603.02639

arXiv ID: 2603.02511

arXiv ID: 2603.02582

arXiv ID: 2603.02743