arXiv ID:
2605.05023
arXiv 提交日期: 2026-05-06
CuBridge:基于大型语言模型的理解与重构高性能注意力核的框架 / CuBridge: An LLM-Based Framework for Understanding and Reconstructing High-Performance Attention Kernels
1️⃣ 一句话总结
CuBridge是一个利用大型语言模型自动处理CUDA注意力核的框架,它通过将专家编写的高效代码转换为中间表示,再根据用户需求重新生成优化后的CUDA代码,从而在保持高性能的同时,轻松适配多种新型注意力机制。