arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 35 72小时内新更新论文 72h更新 112 最新: DAIT: Distillation from Vision-Language Models to Lightweight Classifiers with Adaptive Intermediate Teacher Transfer 03-23

arXiv ID: 2603.00812

arXiv 提交日期: 2026-02-28

natural language processing model training theory sequence modeling efficient attention hierarchical architecture binary tree linear complexity

波吸引子树：一种用于高效序列建模的分层二叉树归约架构 / Wave-Attractor-Tree: A Hierarchical Binary Tree Reduction Architecture for Efficient Sequence Modeling

1️⃣ 一句话总结

这篇论文提出了一种名为“波吸引子树”的新模型架构，它用分层的二叉树结构代替了传统Transformer的自注意力机制，通过递归合并操作，在保持高性能的同时，显著降低了计算复杂度和内存消耗，特别擅长处理需要理解层次化结构的复杂序列数据。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.00397

arXiv 提交日期: 2026-02-28

machine learning model training theory neural pde solver natural gradient boundary conditions physics-informed neural networks time evolution

TENG-BC：适用于一般边界条件的神经PDE求解器的统一时间演化自然梯度方法 / TENG-BC: Unified Time-Evolving Natural Gradient for Neural PDE Solvers with General Boundary Conditions

1️⃣ 一句话总结

这篇论文提出了一种名为TENG-BC的新型高精度神经网络求解器，它通过一种边界感知的优化框架，能够稳定且准确地求解随时间变化的偏微分方程，并能统一处理多种复杂的边界条件，其性能超越了传统方法和现有的物理信息神经网络。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.23113

arXiv 提交日期: 2026-02-26

machine learning model training theory neural operators partial differential equations physics-informed operator splitting neural ode

使用神经算子学习物理算子 / Learning Physical Operators using Neural Operators

1️⃣ 一句话总结

这篇论文提出了一种新的物理信息训练框架，通过将偏微分方程分解为线性和非线性算子，并分别用固定卷积和可训练的神经算子来学习，从而构建了一个模块化、可解释且能泛化到新物理场景的连续时间预测模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22716

arXiv 提交日期: 2026-02-26

multi-modal model training natural language processing positional embedding 3d vision-language models spherical coordinates spatial perception point-cloud

SoPE：基于球坐标的位置嵌入，用于增强3D大视觉语言模型的空间感知能力 / SoPE: Spherical Coordinate-Based Positional Embedding for Enhancing Spatial Perception of 3D LVLMs

1️⃣ 一句话总结

这篇论文提出了一种名为SoPE的新方法，通过将三维点云数据映射到球坐标系来改进3D多模态模型的位置编码，使其能更好地理解和表达物体的空间位置与方向，从而提升了模型在3D场景理解任务上的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22895

arXiv 提交日期: 2026-02-26

machine learning systems model training geometric deep learning spd matrices neural decoding brain computer interface python library

SPD学习：一个通过平凡化实现神经解码的几何深度学习Python库 / SPD Learn: A Geometric Deep Learning Python Library for Neural Decoding Through Trivialization

1️⃣ 一句话总结

本文介绍了一个名为SPD Learn的Python工具包，它通过一种创新的‘平凡化’技术，将复杂的几何约束问题转化为常规的深度学习训练流程，从而让研究人员能更方便、更统一地开发和应用基于对称正定矩阵的神经网络模型来进行大脑神经信号解码。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22960

arXiv 提交日期: 2026-02-26

computer vision video generation model training world models camera control long-term memory video generation diffusion transformer

UCM：通过时间感知位置编码扭曲统一相机控制与记忆的世界模型 / UCM: Unifying Camera Control and Memory with Time-aware Positional Encoding Warping for World Models

1️⃣ 一句话总结

这篇论文提出了一个名为UCM的新框架，它通过一种创新的时间感知位置编码扭曲技术，巧妙地解决了视频生成世界模型中长期内容不一致和相机控制不精准的两大难题，从而能生成既连贯又可控的高质量模拟环境视频。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22645

arXiv 提交日期: 2026-02-26

machine learning systems model training graph neural networks heterogeneous graphs pre-training meta-paths transfer learning

MUG：基于元路径感知的通用异质图预训练方法 / MUG: Meta-path-aware Universal Heterogeneous Graph Pre-Training

1️⃣ 一句话总结

这篇论文提出了一种名为MUG的新方法，它通过统一输入表示和共享编码器，首次解决了为结构复杂的异质图进行通用预训练的难题，使得训练出的模型能够有效适应多种不同的下游任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22919

arXiv 提交日期: 2026-02-26

medical multi-modal model training cardiac digital twin ecg-to-4d generative modeling cardiac motion reconstruction medical imaging

流链：一种从心电信号生成4D心脏数字孪生的基础性框架 / Chain of Flow: A Foundational Generative Framework for ECG-to-4D Cardiac Digital Twins

1️⃣ 一句话总结

这篇论文提出了一个名为‘流链’的基础性生成框架，它能够仅凭一段心电信号就重建出患者个性化的、包含完整结构和动态运动的4D心脏数字孪生，从而将心脏数字孪生从单一任务的预测模型转变为可广泛用于模拟和分析的虚拟心脏。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22742

arXiv 提交日期: 2026-02-26

computer vision multi-modal model training motion generation flow matching kinematic constraints zero-shot control inverse problems

ProjFlow：基于流匹配的投影采样方法，用于零样本精确空间运动控制 / ProjFlow: Projection Sampling with Flow Matching for Zero-Shot Exact Spatial Motion Control

1️⃣ 一句话总结

这篇论文提出了一种名为ProjFlow的新方法，它无需额外训练就能精确控制人体运动的空间位置，同时保持动作的自然流畅性，解决了现有方法在满足硬性约束时常常破坏动作真实感的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22867

arXiv 提交日期: 2026-02-26

computer vision model training systems panoramic segmentation rotation robustness spherical transformers so(3) invariance geometric deep learning

SO3UFormer：学习用于旋转鲁棒全景分割的本征球面特征 / SO3UFormer: Learning Intrinsic Spherical Features for Rotation-Robust Panoramic Segmentation

1️⃣ 一句话总结

这篇论文提出了一种名为SO3UFormer的新模型，它通过设计不依赖特定坐标系的球面特征学习方法，解决了现有全景分割模型在相机发生任意旋转时性能急剧下降的问题，显著提升了模型在真实动态场景下的鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.00812

1️⃣ 一句话总结

arXiv ID: 2603.00397

1️⃣ 一句话总结

arXiv ID: 2602.23113

1️⃣ 一句话总结

arXiv ID: 2602.22716

1️⃣ 一句话总结

arXiv ID: 2602.22895

1️⃣ 一句话总结

arXiv ID: 2602.22960

1️⃣ 一句话总结

arXiv ID: 2602.22645

1️⃣ 一句话总结

arXiv ID: 2602.22919

1️⃣ 一句话总结

arXiv ID: 2602.22742

1️⃣ 一句话总结

arXiv ID: 2602.22867

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.00812 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.00397 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.23113 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22716 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22895 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22960 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22645 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22919 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22742 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22867 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.00812

arXiv ID: 2603.00397

arXiv ID: 2602.23113

arXiv ID: 2602.22716

arXiv ID: 2602.22895

arXiv ID: 2602.22960

arXiv ID: 2602.22645

arXiv ID: 2602.22919

arXiv ID: 2602.22742

arXiv ID: 2602.22867