arXiv最新AI论文速览速学

🔍

model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 88 72小时内新更新论文 72h更新 188 最新: Learning to Recall with Transformers Beyond Orthogonal Embeddings 03-21

arXiv ID: 2603.16568

arXiv 提交日期: 2026-03-17

machine learning model training theory autoencoders unsupervised learning manifold learning dimensionality reduction regularization

流形匹配自编码器 / Manifold-Matching Autoencoders

1️⃣ 一句话总结

这篇论文提出了一种名为流形匹配自编码器的简单无监督正则化方法，它通过让编码器在潜在空间中保持与原始输入数据相同的点间距离关系，来提升数据表示的保真度和可扩展性，效果优于同类方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16188

arXiv 提交日期: 2026-03-17

robotics multi-modal model training humanoid robot control text-to-motion sim-to-real transfer reinforcement learning diffusion models

ECHO：面向语言到运动控制的边缘-云人形机器人协同框架 / ECHO: Edge-Cloud Humanoid Orchestration for Language-to-Motion Control

1️⃣ 一句话总结

本文提出了一个名为ECHO的系统，它利用云端AI将文字指令生成动作，再通过部署在机器人本地的控制器稳定执行，从而实现了让人形机器人直接听懂并完成复杂动作指令的目标。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16271

arXiv 提交日期: 2026-03-17

video generation model training model evaluation video diffusion geometric consistency reward model reinforcement learning multi-view geometry

VIGOR：面向视频几何的时间生成对齐奖励 / VIGOR: VIdeo Geometry-Oriented Reward for Temporal Generative Alignment

1️⃣ 一句话总结

这篇论文提出了一种基于几何的奖励模型，利用预训练的几何基础模型来评估生成视频的多视角一致性，并通过两种互补的路径来对齐视频扩散模型，从而有效减少了视频生成中的物体变形、空间漂移等不一致性伪影，且无需大量计算资源进行重新训练。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16281

arXiv 提交日期: 2026-03-17

medical model training machine learning eeg self-supervised learning representation learning foundation model brain-computer interface

Laya：一种通过潜在预测而非重建的LeJEPA方法用于脑电图研究 / Laya: A LeJEPA Approach to EEG via Latent Prediction over Reconstruction

1️⃣ 一句话总结

这篇论文提出了一种名为Laya的新型脑电图基础模型，它通过预测潜在表征而非重建原始信号来学习，从而比传统方法更能捕捉与任务相关的脑神经特征，并在多项基准测试中取得了更好的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16426

arXiv 提交日期: 2026-03-17

computer vision model training machine learning hyperspectral image classification 3d fourier transform frequency-domain filtering class imbalance adaptive focal loss

基于三维傅里叶变换的高光谱图像分类全局特征提取方法 / 3D Fourier-based Global Feature Extraction for Hyperspectral Image Classification

1️⃣ 一句话总结

本文提出了一种名为HGFNet的新模型，它巧妙地将三维卷积的局部特征提取能力与三维傅里叶变换的全局建模能力相结合，并引入自适应损失函数，从而高效、准确地解决了高光谱图像分类中长距离依赖建模和类别不平衡的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16063

arXiv 提交日期: 2026-03-17

computer vision model training machine learning vision transformers linear attention knowledge transfer model adaptation efficient attention

ViT-AdaLA：使用线性注意力适配视觉Transformer / ViT-AdaLA: Adapting Vision Transformers with Linear Attention

1️⃣ 一句话总结

这篇论文提出了一种名为ViT-AdaLA的新方法，它通过注意力对齐、特征对齐和微调三个步骤，高效地将现有高性能视觉大模型的知识迁移到计算效率更高的线性注意力模型中，从而在保持强大性能的同时显著降低了计算成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16154

arXiv 提交日期: 2026-03-17

computer vision model training systems 4d point clouds spatio-temporal representation temporal invariance gaussian convolution point cloud video

GATS：用于不变4D时空点云表示的高斯感知时序缩放Transformer / GATS: Gaussian Aware Temporal Scaling Transformer for Invariant 4D Spatio-Temporal Point Cloud Representation

1️⃣ 一句话总结

这篇论文提出了一个名为GATS的新模型，它通过结合高斯统计建模和可学习的时序缩放技术，有效解决了4D点云视频分析中因点云分布不均和视频帧率不同带来的挑战，从而在各种动态场景理解任务上取得了更准确、更鲁棒的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16152

arXiv 提交日期: 2026-03-17

llm model training agents instruction following constrained reinforcement learning alignment system prompt compliance hierarchical control

HIPO：通过约束强化学习实现指令层级化 / HIPO: Instruction Hierarchy via Constrained Reinforcement Learning

1️⃣ 一句话总结

这篇论文提出了一种名为HIPO的新方法，它通过约束强化学习让大语言模型能更好地遵循一组有优先级的复杂指令，确保核心系统指令得到严格遵守，同时提升对用户指令的响应效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15923

arXiv 提交日期: 2026-03-16

llm theory model training transformers memory retrieval gradient descent theoretical analysis capacity scaling

超越正交嵌入：基于Transformer的记忆学习研究 / Learning to Recall with Transformers Beyond Orthogonal Embeddings

1️⃣ 一句话总结

这篇论文通过分析在非正交随机嵌入下训练的简单Transformer模型，揭示了其记忆能力（即存储和检索信息的能力）取决于样本数量、嵌入维度和序列长度三者的乘积关系，并证明这种关系是此类模型在现实有限数据场景下的固有特性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15100

arXiv 提交日期: 2026-03-16

medical multi-modal model training pathological response prediction multimodal deep learning missing data non-small cell lung cancer clinical imaging fusion

从有限和不完整数据中学习：一种预测非小细胞肺癌病理反应的多模态框架 / Learning from Limited and Incomplete Data: A Multimodal Framework for Predicting Pathological Response in NSCLC

1️⃣ 一句话总结

这项研究提出了一种多模态深度学习框架，它巧妙地将基于基础模型的CT影像特征提取与能处理缺失临床数据的架构相结合，从而在数据有限且不完整的真实临床场景下，有效提升了非小细胞肺癌患者术前病理反应预测的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.16568

1️⃣ 一句话总结

arXiv ID: 2603.16188

1️⃣ 一句话总结

arXiv ID: 2603.16271

1️⃣ 一句话总结

arXiv ID: 2603.16281

1️⃣ 一句话总结

arXiv ID: 2603.16426

1️⃣ 一句话总结

arXiv ID: 2603.16063

1️⃣ 一句话总结

arXiv ID: 2603.16154

1️⃣ 一句话总结

arXiv ID: 2603.16152

1️⃣ 一句话总结

arXiv ID: 2603.15923

1️⃣ 一句话总结

arXiv ID: 2603.15100

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.16568 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16188 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16271 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16281 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16426 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16063 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16154 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16152 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15923 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15100 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.16568

arXiv ID: 2603.16188

arXiv ID: 2603.16271

arXiv ID: 2603.16281

arXiv ID: 2603.16426

arXiv ID: 2603.16063

arXiv ID: 2603.16154

arXiv ID: 2603.16152

arXiv ID: 2603.15923

arXiv ID: 2603.15100