arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 270 最新: Toward Phonology-Guided Sign Language Motion Generation: A Diffusion Baseline and Conditioning Analysis 03-19

arXiv ID: 2512.14693

arXiv 提交日期: 2025-12-16

llm model training theory universal transformer reasoning arc-agi inductive bias model analysis

通用推理模型 / Universal Reasoning Model

1️⃣ 一句话总结

这篇论文发现通用Transformer在复杂推理任务上的性能提升主要源于其循环结构和强大的非线性能力，并据此提出了一个结合短卷积和截断反向传播的改进模型，在ARC-AGI基准测试上取得了当前最好的成绩。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14681

arXiv 提交日期: 2025-12-16

llm model training systems parallel decoding inference acceleration jacobi forcing distillation kv cache

使用雅可比强制实现快速准确的因果并行解码 / Fast and Accurate Causal Parallel Decoding using Jacobi Forcing

1️⃣ 一句话总结

这篇论文提出了一种名为‘雅可比强制’的训练方法，能够将传统顺序生成的大语言模型高效地转化为并行解码模型，在保持生成质量的同时，显著提升了推理速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14614

arXiv 提交日期: 2025-12-16

video generation computer vision model training streaming video diffusion geometric consistency interactive world modeling context memory real-time generation

WorldPlay：面向实时交互式世界建模的长期几何一致性研究 / WorldPlay: Towards Long-Term Geometric Consistency for Real-Time Interactive World Modeling

1️⃣ 一句话总结

这篇论文提出了一个名为WorldPlay的实时视频生成模型，它通过创新的双动作控制、动态重建记忆和上下文强制蒸馏技术，解决了现有方法在速度与长期几何一致性之间的权衡问题，能够以24帧/秒的速度生成连贯且高质量的长视频。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14531

arXiv 提交日期: 2025-12-16

llm model training systems parameter efficiency feed-forward network adaptive computation model architecture expert mixture

VersatileFFN：通过自适应宽深复用实现大语言模型的参数高效化 / VersatileFFN: Achieving Parameter Efficiency in LLMs via Adaptive Wide-and-Deep Reuse

1️⃣ 一句话总结

这篇论文提出了一种名为VersatileFFN的新型前馈网络，它通过在同一套固定参数内，自适应地复用参数来拓宽模型宽度或加深处理深度，从而在不增加内存开销的前提下，有效提升了大语言模型处理不同难度任务的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14699

arXiv 提交日期: 2025-12-16

video generation model training systems long video generation memory mechanism kv cache streaming video attention efficiency

MemFlow：用于一致且高效长视频叙事的自适应流动记忆 / MemFlow: Flowing Adaptive Memory for Consistent and Efficient Long Video Narratives

1️⃣ 一句话总结

这篇论文提出了一个名为MemFlow的新方法，它通过动态选择和激活与当前生成内容最相关的历史画面来管理记忆，从而在生成超长视频时，既能高效地保持故事内容的连贯性，又几乎不影响生成速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14067

arXiv 提交日期: 2025-12-16

llm model training natural language processing diffusion language models autoregressive models non-autoregressive generation model conversion efficient inference

高效扩散语言模型：从自回归到扩散语言模型的转换及速度提升 / Efficient-DLM: From Autoregressive to Diffusion Language Models, and Beyond in Speed

1️⃣ 一句话总结

这篇论文提出了一种新方法，能够将训练好的自回归语言模型高效地转换成扩散语言模型，在保持原有模型准确性的同时，大幅提升了文本生成速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14008

arXiv 提交日期: 2025-12-16

model training multi-modal natural language processing masked discrete diffusion multimodal generation inference acceleration sparse attention text-to-image

稀疏LaViDa：稀疏多模态离散扩散语言模型 / Sparse-LaViDa: Sparse Multimodal Discrete Diffusion Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为Sparse-LaViDa的新方法，它通过动态移除扩散模型推理过程中不必要的计算，将图像生成和编辑等任务的速度提升了一倍，同时保持了生成质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14666

arXiv 提交日期: 2025-12-16

robotics agents model training vision-language-action test-time training embodied ai adaptive learning environment feedback

EVOLVE-VLA：基于环境反馈的视觉-语言-动作模型测试时训练框架 / EVOLVE-VLA: Test-Time Training from Environment Feedback for Vision-Language-Action Models

1️⃣ 一句话总结

这篇论文提出了一个名为EVOLVE-VLA的新框架，让机器人视觉-语言-动作模型能在实际测试环境中通过与环境的互动来自主学习和改进，从而显著减少对大量人工演示数据的依赖，并提升其在陌生任务和复杂长序列任务中的适应能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14391

arXiv 提交日期: 2025-12-16

llm model training natural language processing in-context learning positional encoding attention allocation cognitive load theory context re-positioning

RePo：具有上下文重定位能力的语言模型 / RePo: Language Models with Context Re-Positioning

1️⃣ 一句话总结

这篇论文提出了一种名为RePo的新方法，它通过一个可学习的模块动态调整输入文本中词语的位置编码，从而帮助语言模型更有效地处理复杂或混乱的上下文信息，提升其在长文本、含噪声数据等任务上的推理能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14550

arXiv 提交日期: 2025-12-16

medical computer vision model training medical image restoration all-in-one model task interference loss balancing transformer

TAT：面向一体化医学图像复原的任务自适应Transformer / TAT: Task-Adaptive Transformer for All-in-One Medical Image Restoration

1️⃣ 一句话总结

这篇论文提出了一种名为TAT的新型任务自适应Transformer框架，它通过动态生成任务专属参数和智能平衡不同任务的损失权重，有效解决了多个医学图像复原任务同时训练时的相互干扰和优化不平衡问题，从而在一体化模型中实现了更优的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2512.14693

1️⃣ 一句话总结

arXiv ID: 2512.14681

1️⃣ 一句话总结

arXiv ID: 2512.14614

1️⃣ 一句话总结

arXiv ID: 2512.14531

1️⃣ 一句话总结

arXiv ID: 2512.14699

1️⃣ 一句话总结

arXiv ID: 2512.14067

1️⃣ 一句话总结

arXiv ID: 2512.14008

1️⃣ 一句话总结

arXiv ID: 2512.14666

1️⃣ 一句话总结

arXiv ID: 2512.14391

1️⃣ 一句话总结

arXiv ID: 2512.14550

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2512.14693 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14681 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14614 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14531 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14699 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14067 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14008 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14666 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14391 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14550 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2512.14693

arXiv ID: 2512.14681

arXiv ID: 2512.14614

arXiv ID: 2512.14531

arXiv ID: 2512.14699

arXiv ID: 2512.14067

arXiv ID: 2512.14008

arXiv ID: 2512.14666

arXiv ID: 2512.14391

arXiv ID: 2512.14550