arXiv ID:
2604.07969
arXiv 提交日期: 2026-04-09
凯瑟琳:一种无需分词或注意力机制的、基于振荡器的字节级文本分类方法 / Kathleen: Oscillator-Based Byte-Level Text Classification Without Tokenization or Attention
1️⃣ 一句话总结
这篇论文提出了一种名为‘凯瑟琳’的新型文本分类模型,它无需分词和复杂的注意力机制,直接处理原始字节数据,通过创新的频率域组件,用极少的参数实现了与大型模型相当甚至更好的性能。