arXiv最新AI论文速览速学

🔍

标签: #attention mechanism ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: Spectral Dynamic Attention Network for Hyperspectral Image Super-Resolution 05-02

arXiv ID: 2604.27326

arXiv 提交日期: 2026-04-30

computer vision machine learning hyperspectral image super-resolution attention mechanism frequency modeling sparse attention

光谱动态注意力网络用于高光谱图像超分辨率 / Spectral Dynamic Attention Network for Hyperspectral Image Super-Resolution

1️⃣ 一句话总结

本文提出了一种名为光谱动态注意力网络（SDANet）的新方法，通过动态通道稀疏注意力和频率增强的前馈网络，有效减少高光谱图像中的冗余信息并提升非线性建模能力，从而在超分辨率任务中实现更清晰、更准确的重建效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24717

arXiv 提交日期: 2026-04-27

llm model training machine learning rotary position embedding attention mechanism sequential modeling recommender system positional encoding

学习旋转：面向序列建模的时间与语义旋转编码 / Learning to Rotate: Temporal and Semantic Rotary Encoding for Sequential Modeling

1️⃣ 一句话总结

本文提出一种新方法，将Transformer中原本固定不变的旋转位置编码（RoPE）改造为可学习的、由输入信号动态驱动的旋转空间，通过引入一个双分支神经网络（SIREN）来编码时间戳、周期模式和元数据等语义信息，从而在不增加太多计算负担的情况下显著提升推荐系统的排序与校准效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.23950

arXiv 提交日期: 2026-04-27

medical llm token pruning attention mechanism vision language model inference acceleration learnable pruning

LearnPruner：重新思考视觉语言模型中基于注意力的令牌剪枝方法 / LearnPruner: Rethinking Attention-based Token Pruning in Vision Language Models

1️⃣ 一句话总结

本文提出了一种名为LearnPruner的两阶段视觉令牌剪枝框架，通过分析视觉编码器和语言模型中注意力机制的缺陷，先由可学习剪枝模块剔除冗余视觉信息，再在语言模型中间层保留关键任务令牌，从而在仅使用5.5%视觉令牌的情况下保持约95%的原始性能，并实现3.2倍的推理加速。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24306

arXiv 提交日期: 2026-04-27

machine learning systems solar power forecasting transformer attention mechanism renewable energy

SolarTformer：基于Transformer的短期太阳能功率预测深度学习方法 / SolarTformer: A Transformer Based Deep Learning Approach for Short Term Solar Power Forecasting

1️⃣ 一句话总结

该研究提出了一种名为SolarTformer的深度学习模型，利用Transformer架构中的自注意力机制，从气象数据中精准预测短期太阳能发电量，并通过引入电站元数据提升了在不同地点、配置和季节下的泛化能力，在晴天和阴天均表现出比传统模型更高的准确性和鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21530

arXiv 提交日期: 2026-04-23

medical multi-modal machine learning lung adenocarcinoma multiple instance learning whole slide images attention mechanism pathology foundation models

基于注意力机制的多示例学习：利用基础模型预测肺腺癌全切片图像中的主要生长模式 / Attention-based multiple instance learning for predominant growth pattern prediction in lung adenocarcinoma wsi using foundation models

1️⃣ 一句话总结

本研究提出一种基于注意力机制的多示例学习方法，通过整合预训练的病理基础模型，仅利用全切片级别的标注即可自动预测肺腺癌的主要生长模式，减轻了对大量精细标注的依赖，并取得了优于传统方法的预测性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.20258

arXiv 提交日期: 2026-04-22

computer vision image editing instruction-based editing edit localization task-aware diffusion transformers attention mechanism

重新思考编辑位置：面向指令的图像编辑中的任务感知定位 / Rethinking Where to Edit: Task-Aware Localization for Instruction-Based Image Editing

1️⃣ 一句话总结

本文提出了一种无需重新训练的、能根据不同类型编辑任务（如添加、删除或替换）自动确定图像中哪些区域需要修改的方法，有效避免了以往方法误改无关区域的问题，从而在保持编辑效果的同时，更好地保留图像中不需要修改的部分。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19414

arXiv 提交日期: 2026-04-21

machine learning data sequential recommendation complementary relations semantic modeling ecommerce attention mechanism

CAST：面向互补感知的序列推荐，建模语义级过渡 / CAST: Modeling Semantic-Level Transitions for Complementary-Aware Sequential Recommendation

1️⃣ 一句话总结

本文提出一种名为CAST的框架，通过在离散语义编码空间中直接建模用户行为序列的语义过渡，并引入大语言模型验证的互补关系先验，从而更精准地识别商品间的真实互补关系，大幅提升序列推荐的准确性和训练效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.13459

arXiv 提交日期: 2026-04-15

systems model training model evaluation remaining useful life prognostics attention mechanism asymmetric loss interpretability

基于非对称损失引导的混合CNN-BiLSTM-Attention模型用于工业剩余寿命预测及可解释故障热图 / Asymmetric-Loss-Guided Hybrid CNN-BiLSTM-Attention Model for Industrial RUL Prediction with Interpretable Failure Heatmaps

1️⃣ 一句话总结

这篇论文提出了一种结合卷积神经网络、双向长短期记忆网络和注意力机制的新模型，用于更安全、更准确地预测航空发动机等工业设备的剩余寿命，并通过可视化热图解释故障演变过程，帮助制定维护决策。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.13479

arXiv 提交日期: 2026-04-15

medical computer vision model training semantic segmentation class imbalance attention mechanism histopathology difficulty learning

通过动态焦点注意力学习不平衡组织病理学分割中的类别难度 / Learning Class Difficulty in Imbalanced Histopathology Segmentation via Dynamic Focal Attention

1️⃣ 一句话总结

这篇论文提出了一种名为动态焦点注意力的新方法，它能让AI模型在分割不平衡的组织病理图像时，自动学习并关注那些真正难以识别的类别（而非仅仅因为出现次数少），从而在多个公开数据集上取得了更好的分割效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.12281

arXiv 提交日期: 2026-04-14

computer vision model training multi-modal style transfer diffusion models attention mechanism training-free image generation

MAST：基于掩码引导注意力质量分配的免训练多风格迁移方法 / MAST: Mask-Guided Attention Mass Allocation for Training-Free Multi-Style Transfer

1️⃣ 一句话总结

这篇论文提出了一种名为MAST的免训练新方法，它通过精确控制扩散模型中的注意力分配，成功解决了多风格图像合成中常见的边界瑕疵和结构失真问题，实现了高质量、无干扰的多风格融合。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.27326

1️⃣ 一句话总结

arXiv ID: 2604.24717

1️⃣ 一句话总结

arXiv ID: 2604.23950

1️⃣ 一句话总结

arXiv ID: 2604.24306

1️⃣ 一句话总结

arXiv ID: 2604.21530

1️⃣ 一句话总结

arXiv ID: 2604.20258

1️⃣ 一句话总结

arXiv ID: 2604.19414

1️⃣ 一句话总结

arXiv ID: 2604.13459

1️⃣ 一句话总结

arXiv ID: 2604.13479

1️⃣ 一句话总结

arXiv ID: 2604.12281

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.27326 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24717 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.23950 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24306 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21530 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.20258 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19414 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.13459 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.13479 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.12281 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.27326

arXiv ID: 2604.24717

arXiv ID: 2604.23950

arXiv ID: 2604.24306

arXiv ID: 2604.21530

arXiv ID: 2604.20258

arXiv ID: 2604.19414

arXiv ID: 2604.13459

arXiv ID: 2604.13479

arXiv ID: 2604.12281