arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 167 最新: MovieTeller: Tool-augmented Movie Synopsis with ID Consistent Progressive Abstraction 02-27

arXiv ID: 2601.21780

arXiv 提交日期: 2026-01-29

theory machine learning model training quantum machine learning hybrid models modular architecture variational quantum circuits generalization theory

量子乐高学习：一种混合人工智能的模块化设计原则 / Quantum LEGO Learning: A Modular Design Principle for Hybrid Artificial Intelligence

1️⃣ 一句话总结

这篇论文提出了一种名为‘量子乐高学习’的模块化框架，它将经典神经网络和量子电路视为可自由组合的‘积木块’，从而更清晰、灵活地构建混合人工智能模型，并证明了在资源受限的情况下，量子模块能带来性能优势。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21406

arXiv 提交日期: 2026-01-29

multi-modal model training computer vision multimodal understanding representation generation post-training visual perception unified models

通过多表征生成增强统一多模态模型的理解能力 / Generation Enhances Understanding in Unified Multimodal Models via Multi-Representation Generation

1️⃣ 一句话总结

这篇论文提出了一种名为UniMRG的后训练方法，通过让统一多模态模型额外学习生成图像的像素、深度和分割图等多种内部表征，来帮助模型更全面、深入地理解视觉内容，从而同时提升其视觉理解和生成能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.22146

arXiv 提交日期: 2026-01-29

llm model training data instruction tuning synthetic data generation pre-training scaling language model

FineInstructions：将合成指令数据扩展至预训练规模 / FineInstructions: Scaling Synthetic Instructions to Pre-Training Scale

1️⃣ 一句话总结

这篇论文提出了一种新方法，能够将海量的互联网预训练文本自动转化为数十亿条高质量的指令-回答对，从而让大语言模型从一开始就通过指令调优目标进行预训练，最终在回答用户提问的任务上取得了比传统预训练方法更好的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21367

arXiv 提交日期: 2026-01-29

machine learning model training theory hebbian learning biologically plausible backpropagation alternative global-local learning neural network training

具有全局指导的赫布学习 / Hebbian Learning with Global Direction

1️⃣ 一句话总结

本文提出了一种结合局部与全局信息的新型赫布学习框架，通过全局信号指导局部学习，使其能在大型网络和复杂任务上取得接近反向传播的性能，从而克服了传统赫布学习因缺乏全局目标而难以扩展的局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.22030

arXiv 提交日期: 2026-01-29

llm model training machine learning model unlearning task arithmetic parameter importance fisher information privacy

面向大语言模型遗忘的逐参数任务算术 / Per-parameter Task Arithmetic for Unlearning in Large Language Models

1️⃣ 一句话总结

本文提出了一种名为逐参数任务算术的新方法，通过为每个模型参数单独调整权重来精准移除大语言模型中的隐私信息，在有效遗忘的同时更好地保留了模型原有的其他知识，比传统方法更高效且实用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.22057

arXiv 提交日期: 2026-01-29

multi-modal model training computer vision unsupervised learning diffusion models disentangled representation adversarial training factor recombination

基于判别器驱动扩散模型的无监督分解与重组 / Unsupervised Decomposition and Recombination with Discriminator-Driven Diffusion Models

1️⃣ 一句话总结

这篇论文提出了一种新的无监督学习方法，通过引入一个判别器来指导扩散模型，使其能自动将复杂数据（如图像、机器人视频）分解成独立的构成要素（如背景、动作），并能高质量地重组这些要素来生成新样本，从而在多个基准测试上超越了现有方法，并成功应用于机器人探索任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21983

arXiv 提交日期: 2026-01-29

machine learning model training theory bayesian inference sequential monte carlo neural networks data annealing particle methods

在序列蒙特卡洛框架中研究神经网络的批次推断 / Investigating Batch Inference in a Sequential Monte Carlo Framework for Neural Networks

1️⃣ 一句话总结

这篇论文提出了一种改进的序列蒙特卡洛采样方法，通过逐步引入小批量数据来近似贝叶斯神经网络的后验分布，在图像分类基准测试中实现了高达6倍的训练加速，且精度损失极小。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.22141

arXiv 提交日期: 2026-01-29

model training machine learning theory neural network pruning lottery ticket hypothesis adaptive subnetworks data heterogeneity parameter efficiency

路由彩票：面向异构数据的自适应子网络 / Routing the Lottery: Adaptive Subnetworks for Heterogeneous Data

1️⃣ 一句话总结

这篇论文提出了一种名为‘路由彩票’的自适应剪枝框架，它能在大型神经网络中为不同类型的数据自动发现并分配专门的、参数更少的子网络，从而在保持高性能的同时，让模型结构更好地匹配现实世界数据的多样性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21252

arXiv 提交日期: 2026-01-29

model training model evaluation systems copyright protection model fingerprinting diffusion models watermarking black-box verification

通过内在模型指纹实现无损版权保护 / Lossless Copyright Protection via Intrinsic Model Fingerprinting

1️⃣ 一句话总结

这篇论文提出了一种名为TrajPrint的新方法，它无需修改模型或进行额外训练，就能通过分析模型生成图像的独特内在路径来提取‘指纹’，从而在不影响模型性能的前提下，有效验证扩散模型的版权归属，尤其适用于无法获取内部信息的黑盒场景。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21342

arXiv 提交日期: 2026-01-29

multi-modal model training benchmark multimodal llm domain-specific data curation retail evaluation benchmark

Ostrakon-VL：面向餐饮与零售商店的领域专家多模态大语言模型 / Ostrakon-VL: Towards Domain-Expert MLLM for Food-Service and Retail Stores

1️⃣ 一句话总结

这篇论文提出了一个专门为餐饮和零售商店场景设计的智能视觉语言模型Ostrakon-VL，通过创新的数据清洗方法和首个行业公开测试基准，在保持较小模型规模的同时，实现了超越更大模型的性能，能更可靠地理解和处理商店环境中的复杂视觉信息。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2601.21780

1️⃣ 一句话总结

arXiv ID: 2601.21406

1️⃣ 一句话总结

arXiv ID: 2601.22146

1️⃣ 一句话总结

arXiv ID: 2601.21367

1️⃣ 一句话总结

arXiv ID: 2601.22030

1️⃣ 一句话总结

arXiv ID: 2601.22057

1️⃣ 一句话总结

arXiv ID: 2601.21983

1️⃣ 一句话总结

arXiv ID: 2601.22141

1️⃣ 一句话总结

arXiv ID: 2601.21252

1️⃣ 一句话总结

arXiv ID: 2601.21342

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2601.21780 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21406 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.22146 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21367 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.22030 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.22057 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21983 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.22141 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21252 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21342 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2601.21780

arXiv ID: 2601.21406

arXiv ID: 2601.22146

arXiv ID: 2601.21367

arXiv ID: 2601.22030

arXiv ID: 2601.22057

arXiv ID: 2601.21983

arXiv ID: 2601.22141

arXiv ID: 2601.21252

arXiv ID: 2601.21342