arXiv ID:
2604.18580
arXiv 提交日期: 2026-04-20
Sessa:选择性状态空间注意力机制 / Sessa: Selective State Space Attention
1️⃣ 一句话总结
这篇论文提出了一种名为Sessa的新型序列模型,它通过将注意力机制嵌入到反馈路径中,实现了比传统Transformer和Mamba模型更优的长程信息记忆能力,在长上下文任务中表现突出。