arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 124 最新: PRISM: Breaking the O(n) Memory Wall in Long-Context LLM Inference via O(1) Photonic Block Selection 03-24

arXiv ID: 2602.21204

arXiv 提交日期: 2026-02-24

theory model training model evaluation test-time training linear attention kv binding online learning sequence modeling

基于KV绑定的测试时训练本质上是线性注意力机制 / Test-Time Training with KV Binding Is Secretly Linear Attention

1️⃣ 一句话总结

这篇论文通过分析发现，基于键值对绑定的测试时训练并非传统认为的在线记忆学习，而本质上是一种学习到的线性注意力算子，这一新视角不仅解释了模型行为，还带来了架构简化和效率提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20994

arXiv 提交日期: 2026-02-24

medical computer vision model training medical imaging brain lesion segmentation weak supervision multimodal mri radiology reports

基于多模态MRI报告发现监督的脑病灶与亚结构分割 / Multimodal MRI Report Findings Supervised Brain Lesion Segmentation with Substructures

1️⃣ 一句话总结

本文提出了一种名为MS-RSuper的新方法，它利用放射科报告中不完整、不确定的定性描述（如‘轻度’、‘可能’）和定量线索（如最大病灶尺寸），来指导脑肿瘤多模态MRI图像的病灶分割，而无需依赖大量精确的像素级标注，并在大规模数据集上验证了其优越性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21133

arXiv 提交日期: 2026-02-24

model training multi-modal aigc vector quantization self-organizing maps generative models interpretability human-in-the-loop

SOM-VQ：面向交互式生成模型的拓扑感知分词方法 / SOM-VQ: Topology-Aware Tokenization for Interactive Generative Models

1️⃣ 一句话总结

这篇论文提出了一种名为SOM-VQ的新方法，它将向量量化与自组织映射相结合，为生成模型学习具有明确拓扑结构的离散编码，使得用户能够通过直观地操作编码空间中的距离来控制和引导生成过程，特别适用于需要人机交互的领域，如人体运动生成。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20930

arXiv 提交日期: 2026-02-24

computer vision model training machine learning rotation invariance image preprocessing geometric transformations convolutional networks data augmentation

计算特征方向以实现旋转无关的图像分析 / Computing a Characteristic Orientation for Rotation-Independent Image Analysis

1️⃣ 一句话总结

这篇论文提出了一种名为‘通用强度方向’的预处理方法，它能为每张图像计算一个全局方向并将其对齐到标准参考系，从而让普通的深度学习模型无需改动结构就能更好地处理旋转后的图像，在多个数据集上取得了比专用旋转不变模型更高的准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20527

arXiv 提交日期: 2026-02-24

reinforcement learning agents model training apprenticeship learning intelligent tutoring systems pedagogical strategies reward learning educational ai

一种用于捕捉演化中学生教学策略的广义学徒学习框架 / A Generalized Apprenticeship Learning Framework for Capturing Evolving Student Pedagogical Strategies

1️⃣ 一句话总结

本研究提出了一种名为THEMES的广义学徒学习框架，它通过少量专家演示来推断并模拟动态变化的教学策略，从而在智能辅导系统中高效地制定出优于现有方法的个性化教学决策。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21052

arXiv 提交日期: 2026-02-24

machine learning model training natural language processing sequential recommendation self-attention positional encoding kernel methods next-item prediction

面向精准下一项推荐的位置感知序列注意力机制 / Position-Aware Sequential Attention for Accurate Next Item Recommendations

1️⃣ 一句话总结

这篇论文提出了一种新的注意力机制，通过一个专门学习位置关系的独立模块来直接调整注意力权重，从而更有效地捕捉用户行为序列中的时间顺序模式，显著提升了下一项推荐的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20758

arXiv 提交日期: 2026-02-24

machine learning model training theory bayesian computation generative adversarial networks posterior sampling deep unfolding mcmc

MCMC核的深度展开：用于高维后验采样的可扩展、模块化且可解释的生成对抗网络 / Deep unfolding of MCMC kernels: scalable, modular & explainable GANs for high-dimensional posterior sampling

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过将传统的马尔可夫链蒙特卡洛采样算法‘展开’成模块化的神经网络结构，构建出既高效又易于理解的生成对抗网络，从而在贝叶斯计算中实现快速、准确且能适应不同参数的后验分布采样。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21154

arXiv 提交日期: 2026-02-24

medical multi-modal model training ecg analysis representation learning contrastive learning generative modeling multimodal fusion

CG-DMER：用于解耦多模态心电图表征学习的混合对比-生成框架 / CG-DMER: Hybrid Contrastive-Generative Framework for Disentangled Multimodal ECG Representation Learning

1️⃣ 一句话总结

这篇论文提出了一个名为CG-DMER的新框架，它通过结合对比学习和生成学习，并引入时空掩码建模与表征解耦对齐策略，有效解决了现有方法在心电图与临床报告多模态融合中忽略导联间时空依赖性和引入文本特有偏差的问题，从而在多种下游任务上取得了领先性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21142

arXiv 提交日期: 2026-02-24

medical multi-modal model training vision-language model radiology longitudinal analysis chest x-ray prognostic vqa

LUMEN：用于预后和诊断的纵向多模态放射学模型 / LUMEN: Longitudinal Multi-Modal Radiology Model for Prognosis and Diagnosis

1️⃣ 一句话总结

这篇论文提出了一个名为LUMEN的新型AI训练框架，它能够通过分析病人不同时间点的多张胸部X光片，自动解读病情变化，不仅帮助医生诊断当前疾病，还能预测未来的健康风险，从而为临床决策提供更全面、更及时的支持。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20689

arXiv 提交日期: 2026-02-24

computer vision model training edge detection crisp edges end-to-end learning matching supervision non-maximum suppression

MatchED：基于端到端匹配监督的清晰边缘检测 / MatchED: Crisp Edge Detection Using End-to-End, Matching-based Supervision

1️⃣ 一句话总结

这篇论文提出了一种名为MatchED的轻量级监督模块，它通过端到端的匹配学习，让边缘检测模型能直接生成清晰的单像素宽边缘，从而摆脱了对传统非可微后处理步骤的依赖，并在多个数据集上取得了领先的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.21204

1️⃣ 一句话总结

arXiv ID: 2602.20994

1️⃣ 一句话总结

arXiv ID: 2602.21133

1️⃣ 一句话总结

arXiv ID: 2602.20930

1️⃣ 一句话总结

arXiv ID: 2602.20527

1️⃣ 一句话总结

arXiv ID: 2602.21052

1️⃣ 一句话总结

arXiv ID: 2602.20758

1️⃣ 一句话总结

arXiv ID: 2602.21154

1️⃣ 一句话总结

arXiv ID: 2602.21142

1️⃣ 一句话总结

arXiv ID: 2602.20689

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.21204 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20994 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21133 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20930 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20527 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21052 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20758 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21154 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21142 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20689 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.21204

arXiv ID: 2602.20994

arXiv ID: 2602.21133

arXiv ID: 2602.20930

arXiv ID: 2602.20527

arXiv ID: 2602.21052

arXiv ID: 2602.20758

arXiv ID: 2602.21154

arXiv ID: 2602.21142

arXiv ID: 2602.20689