arXiv最新AI论文速览速学

🔍

model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 365 最新: Toward Phonology-Guided Sign Language Motion Generation: A Diffusion Baseline and Conditioning Analysis 03-19

arXiv ID: 2603.16489

arXiv 提交日期: 2026-03-17

model training machine learning aigc machine unlearning generative models optimal transport image generation privacy

基于非平衡最优传输的一步生成模型遗忘学习 / Unlearning for One-Step Generative Models via Unbalanced Optimal Transport

1️⃣ 一句话总结

本文提出了一种名为UOT-Unlearn的新方法，通过非平衡最优传输技术，让高效的一步生成模型能够安全地‘忘记’特定类别（例如敏感内容），同时保持整体图像生成质量，解决了现有遗忘方法不适用于此类快速模型的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16869

arXiv 提交日期: 2026-03-17

computer vision model training systems 3d segmentation generative models part segmentation transfer learning 3d vision

SegviGen：将3D生成模型重新用于部件分割 / SegviGen: Repurposing 3D Generative Model for Part Segmentation

1️⃣ 一句话总结

这篇论文提出了一个名为SegviGen的新框架，它巧妙地利用预训练好的3D生成模型内部的结构化知识，通过给3D物体不同部件着色来实现高效、精确的部件分割，仅需极少量的标注数据就能超越现有方法的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16338

arXiv 提交日期: 2026-03-17

computer vision model training machine learning spiking neural networks self-supervised learning event-based vision contrastive learning few-shot learning

SpikeCLR：基于脉冲神经网络和对比自监督学习的小样本事件视觉方法 / SpikeCLR: Contrastive Self-Supervised Learning for Few-Shot Event-Based Vision using Spiking Neural Networks

1️⃣ 一句话总结

这篇论文提出了一个名为SpikeCLR的对比自监督学习框架，让脉冲神经网络能够从未标记的事件相机数据中学习有效的视觉特征，从而在标注数据稀缺的情况下，显著提升小样本和半监督场景下的识别性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16565

arXiv 提交日期: 2026-03-17

systems model training machine learning deep learning inverse design power amplifier surrogate model electromagnetic simulation

基于深度学习的黑盒多尔蒂功率放大器：采用像素化输出合成器并扩展效率范围 / Deep Learning-Driven Black-Box Doherty Power Amplifier with Pixelated Output Combiner and Extended Efficiency Range

1️⃣ 一句话总结

这篇论文提出了一种利用深度学习模型快速设计新型像素化合成器的方法，成功制造出在5G等高功率场景下既能保持高效率又能保证信号质量的多尔蒂功率放大器。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16123

arXiv 提交日期: 2026-03-17

theory model training systems compositional generalization neural architecture higher inductive types functoriality monoidal functor

基于高阶归纳类型的函子式神经网络架构 / Functorial Neural Architectures from Higher Inductive Types

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过将数学中的‘高阶归纳类型’编译成神经网络架构，从根本上解决了神经网络在组合泛化上的失败问题，并证明了其设计的解码器天生具备组合能力，而传统的自注意力机制则无法胜任此类任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16133

arXiv 提交日期: 2026-03-17

computer vision model training systems 3d reconstruction geometric primitives differentiable rendering mesh generation shape representation

DualPrim：使用正负几何基元进行紧凑三维重建 / DualPrim: Compact 3D Reconstruction with Positive and Negative Primitives

1️⃣ 一句话总结

这篇论文提出了一个名为DualPrim的新方法，它通过同时使用‘添加’和‘减去’两种几何基元来重建三维物体，从而生成结构清晰、易于编辑的紧凑模型，比只用‘添加’方式的方法效果更好。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16679

arXiv 提交日期: 2026-03-17

medical computer vision model training medical image retrieval mixture of experts contrastive learning hash learning fine-grained retrieval

HMAR：用于医学图像检索的层级化模态感知专家与动态路由架构 / HMAR: Hierarchical Modality-Aware Expert and Dynamic Routing Medical Image Retrieval Architecture

1️⃣ 一句话总结

这篇论文提出了一个名为HMAR的智能医学图像检索新框架，它通过两个分工不同的专家模块，既能匹配整张图像的全局特征，又能精确查找病灶区域，从而在无需昂贵标注的情况下，实现了更精准、更符合临床需求的图像检索。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16568

arXiv 提交日期: 2026-03-17

machine learning model training theory autoencoders unsupervised learning manifold learning dimensionality reduction regularization

流形匹配自编码器 / Manifold-Matching Autoencoders

1️⃣ 一句话总结

这篇论文提出了一种名为流形匹配自编码器的简单无监督正则化方法，它通过让编码器在潜在空间中保持与原始输入数据相同的点间距离关系，来提升数据表示的保真度和可扩展性，效果优于同类方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16188

arXiv 提交日期: 2026-03-17

robotics multi-modal model training humanoid robot control text-to-motion sim-to-real transfer reinforcement learning diffusion models

ECHO：面向语言到运动控制的边缘-云人形机器人协同框架 / ECHO: Edge-Cloud Humanoid Orchestration for Language-to-Motion Control

1️⃣ 一句话总结

本文提出了一个名为ECHO的系统，它利用云端AI将文字指令生成动作，再通过部署在机器人本地的控制器稳定执行，从而实现了让人形机器人直接听懂并完成复杂动作指令的目标。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16271

arXiv 提交日期: 2026-03-17

video generation model training model evaluation video diffusion geometric consistency reward model reinforcement learning multi-view geometry

VIGOR：面向视频几何的时间生成对齐奖励 / VIGOR: VIdeo Geometry-Oriented Reward for Temporal Generative Alignment

1️⃣ 一句话总结

这篇论文提出了一种基于几何的奖励模型，利用预训练的几何基础模型来评估生成视频的多视角一致性，并通过两种互补的路径来对齐视频扩散模型，从而有效减少了视频生成中的物体变形、空间漂移等不一致性伪影，且无需大量计算资源进行重新训练。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.16489

1️⃣ 一句话总结

arXiv ID: 2603.16869

1️⃣ 一句话总结

arXiv ID: 2603.16338

1️⃣ 一句话总结

arXiv ID: 2603.16565

1️⃣ 一句话总结

arXiv ID: 2603.16123

1️⃣ 一句话总结

arXiv ID: 2603.16133

1️⃣ 一句话总结

arXiv ID: 2603.16679

1️⃣ 一句话总结

arXiv ID: 2603.16568

1️⃣ 一句话总结

arXiv ID: 2603.16188

1️⃣ 一句话总结

arXiv ID: 2603.16271

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.16489 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16869 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16338 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16565 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16123 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16133 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16679 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16568 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16188 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16271 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.16489

arXiv ID: 2603.16869

arXiv ID: 2603.16338

arXiv ID: 2603.16565

arXiv ID: 2603.16123

arXiv ID: 2603.16133

arXiv ID: 2603.16679

arXiv ID: 2603.16568

arXiv ID: 2603.16188

arXiv ID: 2603.16271