arXiv最新AI论文速览速学

🔍

标签: #latent space ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 100 最新: ClothTransformer: Unified Latent-Space Transformers for Scalable Cloth Simulation 05-30

arXiv ID: 2605.27852

arXiv 提交日期: 2026-05-27

machine learning systems multi-modal cloth simulation transformer latent space collision detection dataset

ClothTransformer：面向可扩展布料模拟的统一潜在空间Transformer / ClothTransformer: Unified Latent-Space Transformers for Scalable Cloth Simulation

1️⃣ 一句话总结

本文提出ClothTransformer，利用Transformer模型在压缩后的潜在空间中自回归预测布料运动，首次用一个统一框架处理人体穿着、机器人操作和自由落体等多种场景，既大幅降低模拟误差，又解决了网格分辨率依赖和穿透碰撞等传统难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.27245

arXiv 提交日期: 2026-05-26

machine learning theory symbolic regression iterative refinement latent space amortized inference complexity

通过潜在迭代精化实现符号回归 / Symbolic Regression via Latent Iterative Refinement

1️⃣ 一句话总结

本文提出了一种名为潜在方程嵌入（LEE）的神经符号回归方法，通过在一个功能驱动的潜在空间中进行迭代推理和混合梯度优化，相比现有方法，能以显著更简洁的数学表达式（复杂度低至8-11，而其他方法为20-90）达到同等或更优的拟合精度，并且在数据噪声增加时表现更稳健。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.13013

arXiv 提交日期: 2026-05-13

reinforcement learning machine learning diffusion world model joint embedding model-based rl latent space end-to-end

JEDI：面向在线基于模型强化学习的联合嵌入扩散世界模型 / JEDI: Joint Embedding Diffusion World Model for Online Model-Based Reinforcement Learning

1️⃣ 一句话总结

本文提出JEDI，一种端到端训练的潜在扩散世界模型，通过将扩散去噪损失与JEPA预测性表征学习框架结合，在在线强化学习中既大幅降低了计算成本（显存减少43%、采样速度提升3倍以上），又在Atari100k任务上达到与像素级扩散模型相当甚至更优的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.13448

arXiv 提交日期: 2026-05-13

machine learning theory diffusion models latent space distribution shift representation learning information theory

扩散模型中潜在空间复用的局限性 / On the Limits of Latent Reuse in Diffusion Models

1️⃣ 一句话总结

本文研究了扩散模型在训练后将预先学习到的低维潜在空间直接用于新数据集时，因数据分布变化（特别是子空间方向不一致和环境噪声放大）而导致的性能下降问题，并提出了混合训练策略下所需共享潜在空间维度的理论指导。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.02134

arXiv 提交日期: 2026-05-04

video generation model training video vae predictive learning latent space video dynamics reconstruction

基于预测性潜在变量的视频生成 / Video Generation with Predictive Latents

1️⃣ 一句话总结

本文提出了一种名为预测性视频变分自编码器（PV-VAE）的方法，通过让模型在编码部分过去帧的同时预测未来帧，使得潜在空间能够更好地捕捉视频的动态规律，从而显著提升视频生成的质量和训练效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21489

arXiv 提交日期: 2026-04-23

machine learning systems motion planning autonomous driving diffusion latent space

MISTY：基于混频器单步漂移的高通量运动规划方法 / MISTY: High-Throughput Motion Planning via Mixer-based Single-step Drifting

1️⃣ 一句话总结

本文提出了一种名为MISTY的高效自动驾驶运动规划方法，通过单步推理替代传统扩散模型的多次迭代，利用轻量级网络和潜在空间漂移损失实现了极低延迟（10.1毫秒）下的高质量轨迹生成，在nuPlan基准测试中达到了领先性能，并具备主动超车等灵活决策能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.25249

arXiv 提交日期: 2026-03-26

computer vision model training multi-modal image generation tokenization semantic representation latent space prefix learning

面向语义感知的前缀学习：实现高效令牌的图像生成 / Semantic-Aware Prefix Learning for Token-Efficient Image Generation

1️⃣ 一句话总结

这篇论文提出了一种名为SMAP的新型视觉令牌化方法，通过将类别语义信息强制注入到图像表示学习中，并结合一种创新的尾部令牌丢弃策略，使得生成的图像潜在空间不仅重建质量高，而且语义信息更丰富，从而在少量令牌预算下也能实现高质量的图像生成。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.17637

arXiv 提交日期: 2026-03-18

computer vision model training aigc generative adversarial networks image synthesis mamba architecture class conditioning latent space

DSS-GAN：基于Mamba骨干网络的方向性状态空间生成对抗网络用于类别条件图像合成 / DSS-GAN: Directional State Space GAN with Mamba backbone for Class-Conditional Image Synthesis

1️⃣ 一句话总结

这篇论文提出了一种名为DSS-GAN的新图像生成模型，它首次将Mamba模型作为核心生成器，并通过一种创新的‘方向性潜在路由’技术，将类别信息和随机噪声沿着不同空间方向巧妙结合，从而生成了质量更高、控制更精细的类别相关图像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16413

arXiv 提交日期: 2026-03-17

llm model training systems persistent memory frozen llms adapter training latent space conversational learning

为冻结编码器-解码器大语言模型训练持久性记忆：六种架构方法 / Trained Persistent Memory for Frozen Encoder--Decoder LLMs: Six Architectural Methods

1️⃣ 一句话总结

这篇论文通过一个概念验证研究，证明了在参数被冻结的大语言模型中植入一个可训练的、在连续向量空间中进行读写操作的持久记忆模块是可行的，并提出了六种实现这一目标的架构方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.00935

arXiv 提交日期: 2026-03-01

machine learning model training systems bayesian optimization latent space time-varying objectives molecular design variational autoencoder

时间感知的潜空间贝叶斯优化 / Time-Aware Latent Space Bayesian Optimization

1️⃣ 一句话总结

这篇论文提出了一种名为TALBO的新方法，它解决了在分子设计等复杂领域中，当优化目标随时间变化时，如何高效地在生成模型的潜空间中进行搜索的问题，并在模拟的动态任务中表现优于现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.27852

1️⃣ 一句话总结

arXiv ID: 2605.27245

1️⃣ 一句话总结

arXiv ID: 2605.13013

1️⃣ 一句话总结

arXiv ID: 2605.13448

1️⃣ 一句话总结

arXiv ID: 2605.02134

1️⃣ 一句话总结

arXiv ID: 2604.21489

1️⃣ 一句话总结

arXiv ID: 2603.25249

1️⃣ 一句话总结

arXiv ID: 2603.17637

1️⃣ 一句话总结

arXiv ID: 2603.16413

1️⃣ 一句话总结

arXiv ID: 2603.00935

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.27852 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.27245 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.13013 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.13448 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.02134 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21489 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.25249 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.17637 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16413 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.00935 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.27852

arXiv ID: 2605.27245

arXiv ID: 2605.13013

arXiv ID: 2605.13448

arXiv ID: 2605.02134

arXiv ID: 2604.21489

arXiv ID: 2603.25249

arXiv ID: 2603.17637

arXiv ID: 2603.16413

arXiv ID: 2603.00935