numba pypy,numb教学

　　一.什么是numba？Numba是Python的开源JIT编译器，由Anaconda公司牵头，可以加速Python原生代码的CPU和GPU。Numba对NumPy数组和函数非常友好。解释者可以参考第四章。

　　CUC编程开发成本高，所以一般先用python来尝试加速模型训练。Numba包是python提供的GPU编程开发包。打电话吧。

　　另外还有很多其他的，比如相当于numpy的cupy，用于矩阵运算，pycuda之类的，tensorflow，pytorch等等。

　　参考这篇文章：numba和cupy

　　二、numba下载安装使用conda安装Numba:

　　$ conda install numba或使用pip安装：

　　$ pip安装numba III。numba的使用非常简单。写好不容易啊！

　　from numba import JIT import numpy as NPA=NP . arange(10)b=NP . arange(1，11) @jitdef test():返回一个btest()我们只需要在原代码中增加一行@ jit就可以把一个函数编译成机器码，其他的什么都不需要改动。@符号修饰原始代码，所以类似的写法叫做decorator。

　　这里修饰函数调用的API是有限的！比如熊猫，就是更高级别的套餐。Numba实际上无法理解里面做了什么，所以无法加速。一些常用的机器学习框架，如scikit-learn、tensorflow、pytorch等。已经优化了很多，不适合用Numba做加速。

　　另外，Numba不支持：exception处理，with语句，class定义class，yield from。

　　Numba的@jit decorator就像自动驾驶仪。用户不需要关注它是如何优化的。Numba试图优化它。如果发现不支持，那么Numba会继续使用Python原来的方法来执行函数，也就是Python解释器工作原理的左边部分。这种模式被称为对象模式。

　　Numba的真正实力在于它的nopython模式。将decorator改为@jit(nopython=True)或@njit。Numba会假设你已经很了解加速函数了，强制加速方法，不会进入对象模式。如果编译不成功，会直接抛出异常。Nopython的名字会有点模棱两可，可以理解为不用慢python，强行进入图中Python解释器工作原理的右边部分。简而言之，无脑的nonpython模式是对的！

　　注意Numba库提供了一种惰性编译技术，即只有在运行过程中第一次在代码中找到@jit时才编译代码块。只有用的时候才编译，看起来很懒，所以叫懒编译。使用Numba，总时间=编译时间运行时间。与可以节省的计算时间相比，编译时间成本很小，物有所值。对于一个需要多次调用的Numba函数，只需要编译一次，后面调用的时候就不需要编译了。

　　注意，原生Python速度慢的另一个重要原因是变量类型的不确定性。声明变量的语法很简单，比如a=1，但是它没有指定a是整数还是浮点小数。Python解释器要做大量的类型推断，会非常耗时。同样，Numba推出后，Numba也要先推断出输入输出的类型，才能转换成机器码。为了解决这个问题，Numba给出了一种优化方法，称为Eager编译。

　　From Numba import JIT，int32 @ JIT (int32 (int32，int32)，no Python=true) def F2 (x，y): return x y @ JIT (int32 (int32，int32))告诉Numba你的函数使用的是哪种输入输出。输入在括号内，输出在括号的左边。这样不会加快执行速度，但是会加快编译速度，函数可以更快编译成机器码。

　　具体用法指文学书籍的科技星球。

　　要调用cuda，不需要选择njit decorator，使用cuda.jit即可

　　from numba import cuda @ cuda . JIT def GPU _ add(a，b，result，N):idxWithinGrid=cuda . threadidx . x cuda . block idx . x * cuda . block dim . x grid stride=cuda . grid dim . x * cuda . block dim . x for I in range(idxWithinGrid，N，grid stride):result[I]=a[I]b[I]IV .numba原理python之所以慢，主要是因为解释器。有两种解决方案。一种解决方案是用C/C语言重写Python函数，但这需要程序员熟悉C/C语言，调试速度慢，不适合大多数Python程序员。另一个非常方便快捷的解决方案是使用准时制(JIT)技术。

　　Just-In-Time(JIT)技术为解释语言提供了一种优化，可以克服上述效率问题，大大提高代码执行速度，并保持Python语言的可用性。使用JIT技术时，JIT编译器将Python源代码编译成机器可以直接执行的机器语言，可以直接在CPU等硬件上运行。这样就跳过了原来的虚拟机，执行速度和用C语言编程差不多。

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

相关文章阅读