arXiv最新AI论文速览速学

🔍

model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 150 最新: Towards Training-Free Scene Text Editing 03-26

arXiv ID: 2602.11851

arXiv 提交日期: 2026-02-12

systems agents model training intrusion detection resource optimization distributed systems cybersecurity edge computing

分层网络中协作式入侵检测的资源感知部署优化 / Resource-Aware Deployment Optimization for Collaborative Intrusion Detection in Layered Networks

1️⃣ 一句话总结

这项研究提出了一种新型协作式入侵检测框架，它能根据节点的可用资源和数据类型动态优化检测器部署，从而在分布式环境中以低计算开销实现高效、自适应的入侵检测。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11229

arXiv 提交日期: 2026-02-11

systems model training machine learning physics simulation pde solvers generative models latent dynamics flow matching

用于可泛化长期物理模拟的隐式生成求解器 / Latent Generative Solvers for Generalizable Long-Term Physics Simulation

1️⃣ 一句话总结

这篇论文提出了一种名为LGS的两阶段AI框架，它通过将复杂的物理系统映射到一个共享的隐式空间并学习其动态规律，能够更稳定、高效地预测各种物理现象的长期演化过程，同时显著降低了计算成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10607

arXiv 提交日期: 2026-02-11

machine learning model training theory zeroth-order optimization neural network training query complexity error analysis backpropagation alternative

深度神经网络的分层零阶优化方法 / Hierarchical Zero-Order Optimization for Deep Neural Networks

1️⃣ 一句话总结

本文提出了一种名为分层零阶优化的新方法，通过将深度神经网络按层分解来训练，在不需要计算梯度的情况下，显著降低了计算成本，同时保持了与主流反向传播方法相当的准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10933

arXiv 提交日期: 2026-02-11

multi-agents model training theory stochastic optimal control diffusion models compositional generation cooperative agents generative modeling

CMAD：基于随机最优控制的协同多智能体扩散模型 / CMAD: Cooperative Multi-Agent Diffusion via Stochastic Optimal Control

1️⃣ 一句话总结

这篇论文提出了一种新方法，将多个预训练扩散模型的组合生成问题，看作是一个需要协同合作的随机最优控制问题，让这些模型像智能体一样共同调整生成路径，以实现一个统一的生成目标，而不是简单地将它们的概率分布进行数学组合。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10439

arXiv 提交日期: 2026-02-11

audio agents model training audio language models reinforcement learning tool usage data efficiency audio understanding

AudioRouter：一种基于强化学习的双推理框架，实现数据高效音频理解 / AudioRouter: Data Efficient Audio Understanding via RL based Dual Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为AudioRouter的强化学习框架，它让大型音频语言模型学会智能地决定何时以及如何使用外部音频工具来辅助推理，从而在极少训练数据下显著提升对声音细节的理解能力，避免了传统方法需要海量数据训练的弊端。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11217

arXiv 提交日期: 2026-02-11

llm model training model evaluation knowledge transfer fine-tuning pretraining scaling laws calibration

魔法相关性：理解从预训练到监督微调的知识迁移 / The Magic Correlations: Understanding Knowledge Transfer from Pretraining to Supervised Fine-Tuning

1️⃣ 一句话总结

这篇论文通过系统研究发现，大语言模型从预训练到监督微调的知识迁移效果并不稳定，其可靠程度会因任务类型、评估基准和模型规模的不同而产生巨大差异，为如何高效选择和利用数据来训练模型提供了实用指导。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10630

arXiv 提交日期: 2026-02-11

computer vision model training aigc super-resolution diffusion models generative adversarial networks image restoration model distillation

消除变分自编码器以实现快速高分辨率生成式细节恢复 / Eliminating VAE for Fast and High-Resolution Generative Detail Restoration

1️⃣ 一句话总结

这篇论文提出了一种名为GenDR-Pix的新方法，通过移除传统扩散模型中耗时的变分自编码器模块，并采用多阶段对抗蒸馏等技术，实现了对高分辨率图像（如4K图片）的快速、高质量细节恢复，速度提升近3倍且内存占用大幅减少。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10545

arXiv 提交日期: 2026-02-11

model training theory machine learning model upscaling hyperparameter transfer mu transfer neural network initialization width scaling

高效扩展小模型：基于原理的预热启动与超参数迁移 / $μ$pscaling small models: Principled warm starts and hyperparameter transfer

1️⃣ 一句话总结

这篇论文提出了一种基于理论保证的模型扩展方法，能够将训练好的小模型高效地扩展为更大的模型，并配套开发了一种超参数迁移技术，使得扩展后的大模型无需重新调参就能获得良好的性能，从而大幅节省了计算成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10819

arXiv 提交日期: 2026-02-11

llm reinforcement learning model training policy optimization on-policy learning off-policy knowledge alignment reasoning

RePO：通过重述策略优化桥接在线策略学习与离线策略知识 / RePO: Bridging On-Policy Learning and Off-Policy Knowledge through Rephrasing Policy Optimization

1️⃣ 一句话总结

这篇论文提出了一种名为RePO的新方法，通过让大语言模型先理解外部的高质量知识，再将其重述成符合自身风格的数据来训练，从而既稳定又高效地提升了模型在特定领域任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11007

arXiv 提交日期: 2026-02-11

computer vision model training systems 3d instance segmentation point clouds state space models query decoding efficient architecture

LaSSM：通过局部聚合与状态空间模型实现高效语义-空间查询解码的3D实例分割方法 / LaSSM: Efficient Semantic-Spatial Query Decoding via Local Aggregation and State Space Models for 3D Instance Segmentation

1️⃣ 一句话总结

这篇论文提出了一种名为LaSSM的高效3D实例分割新方法，它通过结合语义与空间信息来初始化查询，并使用一种新颖的局部聚合状态空间模型来逐步优化查询，从而在显著降低计算成本的同时，在多个大型3D场景分割基准测试中取得了领先的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.11851

1️⃣ 一句话总结

arXiv ID: 2602.11229

1️⃣ 一句话总结

arXiv ID: 2602.10607

1️⃣ 一句话总结

arXiv ID: 2602.10933

1️⃣ 一句话总结

arXiv ID: 2602.10439

1️⃣ 一句话总结

arXiv ID: 2602.11217

1️⃣ 一句话总结

arXiv ID: 2602.10630

1️⃣ 一句话总结

arXiv ID: 2602.10545

1️⃣ 一句话总结

arXiv ID: 2602.10819

1️⃣ 一句话总结

arXiv ID: 2602.11007

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.11851 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11229 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10607 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10933 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10439 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11217 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10630 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10545 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10819 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11007 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.11851

arXiv ID: 2602.11229

arXiv ID: 2602.10607

arXiv ID: 2602.10933

arXiv ID: 2602.10439

arXiv ID: 2602.11217

arXiv ID: 2602.10630

arXiv ID: 2602.10545

arXiv ID: 2602.10819

arXiv ID: 2602.11007