arXiv最新AI论文速览速学

🔍

标签: #autoregressive models ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: Generative Modeling of Bach-Style Symbolic Music: A Comparative Study of Autoregressive, Latent-Variable, and Adversarial Approaches 06-12

arXiv ID: 2606.13626

arXiv 提交日期: 2026-06-11

machine learning audio symbolic music generation autoregressive models variational autoencoders generative adversarial networks bach music

巴赫风格符号音乐的生成建模：自回归、潜变量与对抗方法的比较研究 / Generative Modeling of Bach-Style Symbolic Music: A Comparative Study of Autoregressive, Latent-Variable, and Adversarial Approaches

1️⃣ 一句话总结

本文使用巴赫风格的钢琴MIDI数据，比较了三种生成模型（带注意力的自回归LSTM、潜变量模型如VAE和向量量化VAE、以及生成对抗网络），发现自回归模型生成的音乐最连贯，向量量化能解决潜变量模型的后验坍缩问题，而对抗网络虽然能捕捉局部音符模式但难以稳定训练。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.14531

arXiv 提交日期: 2026-05-14

llm machine learning theory diffusion models optimal control autoregressive models flow matching language generation

语言生成作为最优控制：潜在控制空间中的闭环扩散 / Language Generation as Optimal Control: Closed-Loop Diffusion in Latent Control Space

1️⃣ 一句话总结

本文提出将语言生成问题转化为随机最优控制问题，通过近似求解哈密顿-雅可比-贝尔曼方程得到闭环控制策略，并利用流匹配技术在潜在控制空间中进行高效并行采样，从而在保证生成文本质量的同时显著提升采样效率和稳定性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.14591

arXiv 提交日期: 2026-04-16

computer vision model training aigc image editing autoregressive models prompt guidance logit nudging masking scheme

基于掩码逻辑微调提示引导的视觉自回归模型图像编辑 / Prompt-Guided Image Editing with Masked Logit Nudging in Visual Autoregressive Models

1️⃣ 一句话总结

这篇论文提出了一种名为‘掩码逻辑微调’的新方法，让AI模型能够根据文字指令精准地编辑图片中指定的部分，同时完美保留图片中不需要修改的区域，并且编辑速度比当前主流方法快得多。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.11575

arXiv 提交日期: 2026-04-13

natural language processing model training multi-modal pixel-based language models multilingual script diversity autoregressive models orthographic robustness

MIXAR：将基于像素的自回归语言模型扩展到多种语言和文字体系 / MIXAR: Scaling Autoregressive Pixel-based Language Models to Multiple Languages and Scripts

1️⃣ 一句话总结

这篇论文提出了首个在八种不同文字体系语言上训练的生成式像素语言模型MIXAR，它在多语言任务上性能显著优于以往模型，对未见过的语言也表现出很强的鲁棒性，并且模型规模扩大后能力进一步增强。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.07855

arXiv 提交日期: 2026-04-09

llm theory model evaluation constrained generation inference hardness autoregressive models computational complexity conditional sampling

自回归模型条件化中的隐藏偏差 / Hidden Biases in Conditioning Autoregressive Models

1️⃣ 一句话总结

这篇论文指出，当大型语言和音乐模型被用于满足特定格式要求（如押韵、固定结构）的生成任务时，其常用的近似方法会产生隐藏的推理偏差，导致生成结果偏离理论上的真实分布，并且论文从理论上证明了进行精确的条件化生成或解码在计算上是极其困难的。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.08088

arXiv 提交日期: 2026-04-09

natural language processing multi-modal model training text-to-motion autoregressive models motion generation coordinate-based motion editing

基于坐标的双约束自回归运动生成 / Coordinate-Based Dual-Constrained Autoregressive Motion Generation

1️⃣ 一句话总结

本文提出了一种名为CDAMD的新方法，它结合了自回归和扩散模型的优点，通过使用坐标输入和双重约束机制，显著提升了根据文本描述生成人体运动的逼真度和语义准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.25463

arXiv 提交日期: 2026-03-26

model training systems computer vision autoregressive models image generation inference acceleration cloud-device collaboration uncertainty quantification

CIAR：基于区间的协同解码用于图像生成加速 / CIAR: Interval-based Collaborative Decoding for Image Generation Acceleration

1️⃣ 一句话总结

这篇论文提出了一种名为CIAR的云-端协同框架，通过在设备端使用连续概率区间来量化图像生成过程中不同区域的不确定性，从而大幅加速自回归模型的图像生成速度，同时减少对云端计算的依赖并保持图像质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.17995

arXiv 提交日期: 2026-03-18

computer vision model training aigc 3d shape generation tokenization autoregressive models semantic alignment geometric reconstruction

LoST：面向三维形状的语义层级分词方法 / LoST: Level of Semantics Tokenization for 3D Shapes

1️⃣ 一句话总结

这篇论文提出了一种名为LoST的新方法，它通过让AI模型按照语义重要性来理解和编码三维形状，从而用更少的数据量生成更逼真、语义更清晰的三维模型，并显著提升了生成质量和效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.14695

arXiv 提交日期: 2026-03-16

machine learning model training systems autoregressive models materials science thermodynamics generative modeling transformers

用于晶格热力学的自回归模型规模化研究 / Scaling Autoregressive Models for Lattice Thermodynamics

1️⃣ 一句话总结

本研究提出了一种结合灵活顺序自回归模型与边缘化近似模型的新框架，能够以更低计算成本高效学习并预测晶体材料的原子构型分布，准确捕捉相变等关键热力学行为，从而克服了传统模拟方法在速度和规模上的限制。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08683

arXiv 提交日期: 2026-03-09

audio model training benchmark lossless compression language modeling autoregressive models audio codecs byte-level tokenization

全保真音频无损压缩的语言建模基准测试 / Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

1️⃣ 一句话总结

这项研究评估了基于语言模型的无损音频压缩方法，发现它在8位和16位音频上能超越传统压缩格式（如FLAC），并提出了一种名为Trilobyte的新编码方案，首次实现了对24位高保真音频的可行压缩，但压缩效果会随着比特深度的增加而减弱。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.13626

1️⃣ 一句话总结

arXiv ID: 2605.14531

1️⃣ 一句话总结

arXiv ID: 2604.14591

1️⃣ 一句话总结

arXiv ID: 2604.11575

1️⃣ 一句话总结

arXiv ID: 2604.07855

1️⃣ 一句话总结

arXiv ID: 2604.08088

1️⃣ 一句话总结

arXiv ID: 2603.25463

1️⃣ 一句话总结

arXiv ID: 2603.17995

1️⃣ 一句话总结

arXiv ID: 2603.14695

1️⃣ 一句话总结

arXiv ID: 2603.08683

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.13626 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.14531 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.14591 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.11575 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.07855 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.08088 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.25463 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.17995 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.14695 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08683 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.13626

arXiv ID: 2605.14531

arXiv ID: 2604.14591

arXiv ID: 2604.11575

arXiv ID: 2604.07855

arXiv ID: 2604.08088

arXiv ID: 2603.25463

arXiv ID: 2603.17995

arXiv ID: 2603.14695

arXiv ID: 2603.08683