🤖 系统
12-04 15:03
CUDA-L2:通过强化学习超越cuBLAS的矩阵乘法性能 / CUDA-L2: Surpassing cuBLAS Performance for Matrix Multiplication through Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一个名为CUDA-L2的系统,它利用大语言模型和强化学习来自动优化GPU上的矩阵乘法计算核心,其性能超越了包括英伟达官方库在内的现有最佳方案,证明了AI自动化优化可以突破人类手动优化的性能极限。