arXiv最新AI论文速览速学

🔍

标签: #transformer ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 89 72小时内新更新论文 72h更新 189 最新: FiLMMeD: Feature-wise Linear Modulation for Cross-Problem Multi-Depot Vehicle Routing 05-01

arXiv ID: 2604.28102

arXiv 提交日期: 2026-04-30

machine learning multi-modal vehicle routing multi-depot multi-task learning transformer optimization

特征级线性调制：面向跨问题多车场车辆路径问题的统一神经求解方法 / FiLMMeD: Feature-wise Linear Modulation for Cross-Problem Multi-Depot Vehicle Routing

1️⃣ 一句话总结

该论文提出了一种名为FiLMMeD的神经网络模型，通过引入特征级线性调制技术，让模型能根据不同的约束条件动态调整内部处理方式，从而统一高效地求解多达24种不同变体的多车场车辆路径问题，并在性能上超越了现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26582

arXiv 提交日期: 2026-04-29

machine learning multi-modal transformer celestial orientation spherical topology attitude determination deep learning

星融合：一种基于球形拓扑的多模态Transformer架构，用于离散天文定向 / Star-Fusion: A Multi-modal Transformer Architecture for Discrete Celestial Orientation via Spherical Topology

1️⃣ 一句话总结

该论文提出了一种名为Star-Fusion的多模态深度学习模型，通过将天文定向问题转化为离散拓扑分类任务，并融合图像、空间位置和坐标信息，在减少计算量的同时实现了高精度姿态估计，适合在资源有限的卫星上实时运行。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24353

arXiv 提交日期: 2026-04-27

computer vision machine learning autonomous driving hd mapping lane detection transformer crowdsourced data topology estimation

基于注意力机制与HSV变换众包车辆轨迹数据的栅格化编码方法用于道路拓扑结构估计 / ARETE: Attention-based Rasterized Encoding for Topology Estimation using HSV-transformed Crowdsourced Vehicle Fleet Data

1️⃣ 一句话总结

本文提出了一种名为ARETE的新方法，通过将众包车辆轨迹转化为类似图像的颜色编码栅格图，再使用类似目标检测的注意力模型，自动提取出车道中心线和车道分割线，从而低成本、高精度地生成并更新自动驾驶所需的高清地图。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24306

arXiv 提交日期: 2026-04-27

machine learning systems solar power forecasting transformer attention mechanism renewable energy

SolarTformer：基于Transformer的短期太阳能功率预测深度学习方法 / SolarTformer: A Transformer Based Deep Learning Approach for Short Term Solar Power Forecasting

1️⃣ 一句话总结

该研究提出了一种名为SolarTformer的深度学习模型，利用Transformer架构中的自注意力机制，从气象数据中精准预测短期太阳能发电量，并通过引入电站元数据提升了在不同地点、配置和季节下的泛化能力，在晴天和阴天均表现出比传统模型更高的准确性和鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24762

arXiv 提交日期: 2026-04-27

video computer vision machine learning shot boundary detection transformer benchmark synthetic data video segmentation

全视剪辑：基于镜头查询Transformer的整体关系型镜头边界检测 / OmniShotCut: Holistic Relational Shot Boundary Detection with Shot-Query Transformer

1️⃣ 一句话总结

本文提出了一种名为OmniShotCut的新方法，它利用镜头查询Transformer将视频切分任务转化为对镜头内部和镜头之间关系的整体预测，能够更准确地识别各种镜头切换，并解决现有方法在边界模糊、微小错误和训练数据不足方面的缺陷。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21387

arXiv 提交日期: 2026-04-23

computer vision machine learning point cloud edge detection transformer local patch 3d geometry

EdgeFormer：基于局部补丁的点云边缘检测Transformer / EdgeFormer: local patch-based edge detection transformer on point clouds

1️⃣ 一句话总结

本文提出一种名为EdgeFormer的新型点云边缘检测方法，通过将整个点云拆解成多个局部小区域（局部补丁），并利用Transformer对这些补丁的特征进行分类，从而更精准地捕捉传统方法难以识别的细小边缘特征，实验表明其性能优于六种现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21690

arXiv 提交日期: 2026-04-23

llm biology model evaluation genome language model explainability transformer dnabert-2 attention

评估基于Transformer的基因组语言模型DNABERT-2的事后解释 / Evaluating Post-hoc Explanations of the Transformer-based Genome Language Model DNABERT-2

1️⃣ 一句话总结

本文研究了如何为先进的基因组语言模型DNABERT-2生成可解释性分析，通过改进一种名为AttnLRP的方法，成功将模型对DNA序列的预测转化为人类可理解的生物学模式，并证明其解释质量与传统卷积神经网络模型相当。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21629

arXiv 提交日期: 2026-04-23

machine learning model training n-grams lstm transformer ensemble methods event-log prediction

推广简单模型：用于事件日志预测的集成方法 / Promoting Simple Agents: Ensemble Methods for Event-Log Prediction

1️⃣ 一句话总结

本文发现，在处理流式事件日志中的下一步活动预测时，简单的n-gram模型在准确率上能与复杂的LSTM和Transformer等神经网络模型相媲美，且资源消耗更少；同时提出了一种名为“推广算法”的轻量级集成方法，通过动态选择两个模型来减少计算开销，从而在保证性能的同时实现更高效的预测。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.20368

arXiv 提交日期: 2026-04-22

computer vision model training linear attention laplacian kernel transformer nyström approximation image classification

拉普拉斯变换器：用拉普拉斯核重新思考线性注意力机制 / LaplacianFormer:Rethinking Linear Attention with Laplacian Kernel

1️⃣ 一句话总结

本文提出了一种名为拉普拉斯变换器的新型Transformer架构，通过使用拉普拉斯核代替传统的softmax注意力机制，在保持线性计算复杂度的同时更准确地捕捉长距离和中距离的像素交互，并搭配高效的数值算法和GPU加速，在图像识别任务上实现了更好的性能与效率平衡。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19570

arXiv 提交日期: 2026-04-21

medical computer vision model training image segmentation rectified flow transformer efficient inference multi-scale

RF-HiT：用于通用医学图像分割的修正流层次化Transformer / RF-HiT: Rectified Flow Hierarchical Transformer for General Medical Image Segmentation

1️⃣ 一句话总结

本文提出了一种名为RF-HiT的高效医学图像分割模型，通过结合层次化Transformer和修正流技术，在保持低计算量和极少推理步数的同时，实现了与大型复杂模型相当的高精度分割性能，适合实时临床应用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.28102

1️⃣ 一句话总结

arXiv ID: 2604.26582

1️⃣ 一句话总结

arXiv ID: 2604.24353

1️⃣ 一句话总结

arXiv ID: 2604.24306

1️⃣ 一句话总结

arXiv ID: 2604.24762

1️⃣ 一句话总结

arXiv ID: 2604.21387

1️⃣ 一句话总结

arXiv ID: 2604.21690

1️⃣ 一句话总结

arXiv ID: 2604.21629

1️⃣ 一句话总结

arXiv ID: 2604.20368

1️⃣ 一句话总结

arXiv ID: 2604.19570

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.28102 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26582 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24353 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24306 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24762 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21387 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21690 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21629 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.20368 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19570 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.28102

arXiv ID: 2604.26582

arXiv ID: 2604.24353

arXiv ID: 2604.24306

arXiv ID: 2604.24762

arXiv ID: 2604.21387

arXiv ID: 2604.21690

arXiv ID: 2604.21629

arXiv ID: 2604.20368

arXiv ID: 2604.19570