arXiv ID:
2602.02988
arXiv 提交日期: 2026-02-03
NLI:一种用于高效大语言模型推理的非线性操作非均匀线性插值近似方法 / NLI:Non-uniform Linear Interpolation Approximation of Nonlinear Operations for Efficient LLMs Inference
1️⃣ 一句话总结
这篇论文提出了一种名为NLI的创新方法,通过将非线性函数近似问题转化为动态规划问题,高效且精准地替代大语言模型中的复杂非线性计算,从而在不损失精度的前提下,显著提升了模型的推理速度,硬件实验显示其计算效率比现有最优方案提升了4倍以上。