arXiv最新AI论文速览速学

🔍

标签: #transformer architecture ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 95 72小时内新更新论文 72h更新 100 最新: Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records 03-16

arXiv ID: 2603.09685

arXiv 提交日期: 2026-03-10

medical natural language processing llm electronic health records clinical risk stratification transformer architecture zero-shot learning multimodal fusion

利用大上下文电子患者健康记录进行自动心脏风险管理分类 / Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

1️⃣ 一句话总结

这项研究开发了一个自动分类系统，通过分析大量非结构化的电子健康记录来评估老年患者的心脏病风险，发现专门设计的深度学习模型比传统机器学习或通用大语言模型更准确，为临床风险自动化评估提供了有效方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.04811

arXiv 提交日期: 2026-03-05

medical computer vision model training medical imaging brain tumor segmentation metadata integration missing modality transformer architecture

Meta-D：用于脑肿瘤分析和缺失模态分割的元数据感知架构 / Meta-D: Metadata-Aware Architectures for Brain Tumor Analysis and Missing-Modality Segmentation

1️⃣ 一句话总结

这篇论文提出了一个名为Meta-D的新方法，它通过巧妙地利用扫描仪的类型信息（如MRI序列和扫描方向）来指导特征提取，从而在脑肿瘤检测和分割任务中显著提升了性能，尤其是在某些扫描数据缺失的情况下，模型表现更稳定且更高效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21371

arXiv 提交日期: 2026-02-24

llm model training theory attention mechanism multi-head attention reasoning parameter efficiency transformer architecture

交错头注意力机制 / Interleaved Head Attention

1️⃣ 一句话总结

这篇论文提出了一种名为‘交错头注意力’的新方法，通过让注意力头之间在计算时相互通信，有效解决了传统多头注意力机制在处理多步推理任务时信息不互通的问题，从而提升了大型语言模型在数学解题和复杂信息检索等任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16320

arXiv 提交日期: 2026-02-18

medical computer vision model training 3d medical image segmentation transformer architecture computational efficiency cross-attention fusion lightweight model

RefineFormer3D：通过自适应多尺度Transformer与交叉注意力融合实现高效3D医学图像分割 / RefineFormer3D: Efficient 3D Medical Image Segmentation via Adaptive Multi-Scale Transformer with Cross Attention Fusion

1️⃣ 一句话总结

这篇论文提出了一种名为RefineFormer3D的轻量级3D医学图像分割模型，它通过创新的高效模块设计，在保持高精度的同时大幅减少了计算量和内存占用，使其更适合在临床环境中实际部署。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.19895

arXiv 提交日期: 2026-01-27

llm model training theory transformer architecture layer normalization gradient flow deep networks highway connection

后层归一化回归：稳定、高表达力与深度扩展 / Post-LayerNorm Is Back: Stable, ExpressivE, and Deep

1️⃣ 一句话总结

这篇论文提出了一种名为Keel的新Transformer架构，它通过将传统的残差连接替换为高速公路式连接，解决了后层归一化在极深网络中训练不稳定的问题，从而能够稳定训练超过1000层的模型，为实现更深、表达能力更强的大语言模型提供了一种简单有效的方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.13689

arXiv 提交日期: 2025-12-15

computer vision model training machine learning 3d point cloud transformer architecture positional encoding neural architecture design efficiency optimization

LitePT：更轻便且更强大的点云Transformer / LitePT: Lighter Yet Stronger Point Transformer

1️⃣ 一句话总结

这篇论文提出了一种新的3D点云处理模型，它通过巧妙地在网络浅层使用卷积提取几何细节、在深层使用注意力机制捕捉语义信息，并引入一种无需训练的位置编码来保持空间结构，最终实现了模型参数量、运行速度和内存消耗的大幅降低，同时性能与当前最优模型相当甚至更优。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.10938

arXiv 提交日期: 2025-12-11

model training machine learning theory normalization-free transformer architecture activation function function design deep learning

更强大的无归一化Transformer / Stronger Normalization-Free Transformers

1️⃣ 一句话总结

这篇论文提出了一种名为Derf的新型激活函数，它通过搜索发现并采用高斯累积分布函数，在无需传统归一化层的情况下，在图像识别、语音和DNA建模等多个领域超越了现有方法，主要得益于其更强的泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.23199

arXiv 提交日期: 2025-11-28

computer vision model training multi-modal bridge models conditional generation image editing video translation transformer architecture

大规模视觉桥接变换器 / Vision Bridge Transformer at Scale

1️⃣ 一句话总结

这篇论文提出了一种名为ViBT的大规模视觉桥接变换器模型，它通过直接建模输入与输出之间的转换路径，而非从噪声生成数据，从而高效地实现了图像和视频的编辑与翻译任务，并在高达200亿参数的规模上验证了其有效性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.19797

arXiv 提交日期: 2025-11-24

model training computer vision machine learning flow matching diffusion models generative modeling transformer architecture image generation

终端速度匹配 / Terminal Velocity Matching

1️⃣ 一句话总结

这项研究提出了一种名为终端速度匹配的新方法，通过优化扩散模型在生成结束时的行为，实现了仅需1到4步就能生成高质量图像，在ImageNet数据集上取得了当前最优的单步/少步生成效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.25976

arXiv 提交日期: 2025-10-29

medical computer vision model training fmri reconstruction brain-computer interface transformer architecture diffusion models neural decoding

Brain-IT：基于脑交互Transformer的功能磁共振成像图像重建 / Brain-IT: Image Reconstruction from fMRI via Brain-Interaction Transformer

1️⃣ 一句话总结

这项研究提出了一种名为Brain-IT的新方法，通过模拟大脑功能区交互的Transformer模型，能够仅用少量脑扫描数据就高精度地重建人脑看到的图像，其效果优于现有技术。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.09685

1️⃣ 一句话总结

arXiv ID: 2603.04811

1️⃣ 一句话总结

arXiv ID: 2602.21371

1️⃣ 一句话总结

arXiv ID: 2602.16320

1️⃣ 一句话总结

arXiv ID: 2601.19895

1️⃣ 一句话总结

arXiv ID: 2512.13689

1️⃣ 一句话总结

arXiv ID: 2512.10938

1️⃣ 一句话总结

arXiv ID: 2511.23199

1️⃣ 一句话总结

arXiv ID: 2511.19797

1️⃣ 一句话总结

arXiv ID: 2510.25976

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.09685 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.04811 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21371 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16320 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.19895 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.13689 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.10938 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.23199 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.19797 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.25976 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.09685

arXiv ID: 2603.04811

arXiv ID: 2602.21371

arXiv ID: 2602.16320

arXiv ID: 2601.19895

arXiv ID: 2512.13689

arXiv ID: 2512.10938

arXiv ID: 2511.23199

arXiv ID: 2511.19797

arXiv ID: 2510.25976