arXiv最新AI论文速览速学

🔍

model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 174 最新: Describe-Then-Act: Proactive Agent Steering via Distilled Language-Action World Models 03-25

arXiv ID: 2603.03269

arXiv 提交日期: 2026-03-03

computer vision model training systems 3d reconstruction long-context video memory architecture geometric foundation models video processing

LoGeR：基于混合内存的长上下文几何重建 / LoGeR: Long-Context Geometric Reconstruction with Hybrid Memory

1️⃣ 一句话总结

这篇论文提出了一种名为LoGeR的新架构，它通过一种创新的混合内存模块，能够高效、准确地将短视频的3D重建技术扩展到长达数千帧的极长视频序列，解决了长期重建中的尺度漂移和边界对齐难题，性能大幅超越现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02840

arXiv 提交日期: 2026-03-03

model training machine learning data time series foundation models fine-tuning zero-shot forecasting data mixtures domain adaptation

通过数据混合适配时间序列基础模型 / Adapting Time Series Foundation Models through Data Mixtures

1️⃣ 一句话总结

这篇论文提出了一种名为MixFT的新方法，它通过智能地重新划分和混合数据来微调时间序列基础模型，从而比传统方法更能让模型适应新领域中的不同数据模式，最终提升其在零样本预测任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02874

arXiv 提交日期: 2026-03-03

model training model evaluation theory in-context retrieval hybrid architectures state space models positional encoding length generalization

检索能力探究：Transformer、状态空间模型与混合架构的上下文检索能力 / Retrievit: In-context Retrieval Capabilities of Transformers, State Space Models, and Hybrid Architectures

1️⃣ 一句话总结

这篇论文通过两项合成检索任务发现，结合Transformer和状态空间模型的混合架构在数据效率和信息密集检索上能媲美甚至超越Transformer，但在位置检索任务上Transformer仍占优，并揭示了不同模型学习位置关联方式的根本差异。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02692

arXiv 提交日期: 2026-03-03

computer vision model training model evaluation image super-resolution diffusion models detail preservation one-step inference real-world reconstruction

FiDeSR：一种高保真且保留细节的一步扩散超分辨率方法 / FiDeSR: High-Fidelity and Detail-Preserving One-Step Diffusion Super-Resolution

1️⃣ 一句话总结

这篇论文提出了一种名为FiDeSR的新方法，它通过创新的训练和推理技术，在单步内就能将低分辨率图像超清放大，同时更好地保留图像细节并确保高保真的重建效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02637

arXiv 提交日期: 2026-03-03

multi-agents systems model training gpu programming multi-agent systems reinforcement learning code generation automated optimization

StitchCUDA：一种基于评分标准的多智能体端到端GPU编程自动化框架 / StitchCUDA: An Automated Multi-Agents End-to-End GPU Programing Framework with Rubric-based Agentic Reinforcement Learning

1️⃣ 一句话总结

这篇论文提出了一个名为StitchCUDA的多智能体框架，它能够自动生成完整的GPU程序，通过让不同的智能体分工协作并利用基于评分标准的强化学习来提升编程能力，从而在保证程序正确性的同时显著提升运行速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02908

arXiv 提交日期: 2026-03-03

llm model training model evaluation transferability sparse autoencoder interpretability fine-tuning feature analysis

SAE作为水晶球：无需训练，利用可解释特征预测大语言模型的跨领域可迁移性 / SAE as a Crystal Ball: Interpretable Features Predict Cross-domain Transferability of LLMs without Training

1️⃣ 一句话总结

这篇论文提出了一种名为STS的新方法，它利用稀疏自编码器分析大语言模型内部特征的变化，能够在模型进行下游任务微调之前，就准确预测其在不同领域应用中的表现好坏，为模型优化提供了可解释的指导工具。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02893

arXiv 提交日期: 2026-03-03

computer vision model training multi-modal 3d reconstruction gaussian splatting human rendering sparse-view diffusion models

面向稀疏视图高斯溅射的内在几何-外观一致性优化 / Intrinsic Geometry-Appearance Consistency Optimization for Sparse-View Gaussian Splatting

1️⃣ 一句话总结

这篇论文提出了一种名为MVD-HuGaS的新方法，它能够仅用一张人物照片，通过一个经过优化的多视图扩散模型生成多个角度的图像，并联合优化3D模型和相机姿态，最终重建出可以从任意角度自由观看、细节逼真的3D数字人。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02794

arXiv 提交日期: 2026-03-03

audio machine learning model training speech denoising iir filtering differentiable dsp real-time processing interpretable models

用于实时语音降噪的可微分时变IIR滤波 / Differentiable Time-Varying IIR Filtering for Real-Time Speech Denoising

1️⃣ 一句话总结

这篇论文提出了一种名为TVF的低延迟、可解释的语音增强模型，它通过一个轻量级神经网络实时预测滤波器系数，将传统信号处理的透明性与深度学习的适应性相结合，从而有效应对动态变化的噪声环境。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02681

arXiv 提交日期: 2026-03-03

agents multi-modal model training visual generation agentic model end-to-end learning benchmark reinforcement learning

VisionCreator：一个具备理解、思考、规划和创造能力的原生视觉生成智能体模型 / VisionCreator: A Native Visual-Generation Agentic Model with Understanding, Thinking, Planning and Creation

1️⃣ 一句话总结

这篇论文提出了一个名为VisionCreator的新型智能体模型，它通过一个端到端的可学习框架，将理解、思考、规划和创造能力融为一体，能够自主完成复杂的视觉内容创作任务，并且在多项测试中表现优于更大的闭源模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02562

arXiv 提交日期: 2026-03-03

systems model training machine learning federated learning edge computing communication efficiency model migration iot

EdgeFLow：一种通过边缘网络中顺序模型迁移实现的无服务器联邦学习框架 / EdgeFLow: Serverless Federated Learning via Sequential Model Migration in Edge Networks

1️⃣ 一句话总结

这篇论文提出了一种名为EdgeFLow的新方法，它通过让模型在边缘基站之间像接力棒一样顺序传递和聚合，完全绕开云端服务器，从而在保证学习效果的同时，大幅降低了物联网设备进行联邦学习时的通信开销。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.03269

1️⃣ 一句话总结

arXiv ID: 2603.02840

1️⃣ 一句话总结

arXiv ID: 2603.02874

1️⃣ 一句话总结

arXiv ID: 2603.02692

1️⃣ 一句话总结

arXiv ID: 2603.02637

1️⃣ 一句话总结

arXiv ID: 2603.02908

1️⃣ 一句话总结

arXiv ID: 2603.02893

1️⃣ 一句话总结

arXiv ID: 2603.02794

1️⃣ 一句话总结

arXiv ID: 2603.02681

1️⃣ 一句话总结

arXiv ID: 2603.02562

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.03269 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02840 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02874 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02692 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02637 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02908 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02893 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02794 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02681 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02562 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.03269

arXiv ID: 2603.02840

arXiv ID: 2603.02874

arXiv ID: 2603.02692

arXiv ID: 2603.02637

arXiv ID: 2603.02908

arXiv ID: 2603.02893

arXiv ID: 2603.02794

arXiv ID: 2603.02681

arXiv ID: 2603.02562