numpy学习笔记

Numpy的对象是同质的多维数组，数组的元素属于同一类型，数组索引是一个正整数元组。在numpy中，维度即是轴。

Numpy的数组类叫做ndarray。ndarray类有如下一些属性：

1、 ndarray.ndim：数组轴的个数。

2、 ndarray.shape：数组的维度，这是一个整数元组，元组的元素表明了数组的每一个维度的大小。元组的元素个数即是维度的数目。

3、 ndarray.size：数组元素的个数。

4、 ndarray.dtype：一个描述数组元素的类型的对象，通常为int32，int16，float64。

5、 ndarray.itemsize：每一个元素所占的字节数。

6、 ndarray.data：数组中实际元素的备份。通常无需使用这个属性，因为我们可以直接使用索引来访问数组中的元素。

创建数组

创建数组有以下几种方式：

1、从Python的列表或者元组来创建数组，需要使用函数array()，这个函数返回一个ndarray类的对象；调用这个函数时常见的错误是使用一系列的数字来调用，而不是一个序列（列表或者元组）；使用函数array()创建数组时，包含序列的序列会被转换为二维数组，含有多个包含序列的序列会被转换为三维数组。在创建数组时，数组元素的类型可以被指定。

2、在创建数组时，通常我们知道数组的大小，但是不知道数组的具体元素，我们可以创建一个指定大小的数组，其元素全部为0或1。ones()函数可创建一个元素全部为0的数组，调用这个函数时，需要将数组的维度以元组形式传入，如:ones((2,3))创建了一个2行3列的二维数组，ones((2,3,4))创建了一个2层3行4列的数组；zeros()函数与ones()类似，可以创建一个初始元素全为0的数组，其调用方法与ones()相同，在调用这个函数时也可以指定元素的类型。empty()函数可以创建一个初始值由内存状态决定的随机的数组。

3、函数arange()可以创建一个数字序列，这一点同python里的函数range()类似；不同的是range()函数返回的是一个列表，而arange()函数返回的是一个一维数组。arange()函数在调用时可以指定起始起始值和终止值以及步长。由于浮点数在存储时的精度有限，因此在传入函数arange()的参数为浮点数的情况下，数组中的元素个数可能无法预测。linspace()函数为我们解决了这个问题，linspace()的第三个参数是元素的个数，而不是步长，这样数组的元素个数就是我们想要的个数。

打印数组

第一行从左到右输出；每行依次自上而下输出；每个切片通过一个空行与下一个隔开；一维数组被打印成行，二维数组成矩阵，三维数组成矩阵列表。

基本运算

1、数组的算术运算是逐元素的，例如：加、减、乘、除。算术运算会创建一个新的数组，并以算术运算的结果来填充这个新的数组。

2、需要注意的是，在numpy里，*（乘法）也是逐元素的，如果需要实现矩阵乘法，需要使用矩阵点乘函数dot()，如：A.dot(B)表示矩阵A与矩阵B做矩阵乘法运算，也可以表示为np.dot(A,B)。

3、 +=，*=等运算则是直接在原数组的基础上做修改，并不会创建新的数组。

4、当不同类型的数组做运算时，运算的结果会与更精确的那个类型相关（向上转换）。

5、许多一元运算，如求数组元素的和，求最大值，最小值等，将这个运算作为ndarray这个类的一个方法来使用，如：A.sum()。这种运算似乎将这个数组当作一个列表来处理，然而你也可以在运算时指定轴的值，此时运算将会沿着特定的轴进行。

通用函数

Numpy提供了例如sin、cos、exp等函数，在numpy中他们被称为通用函数。这些函数对数组逐元素运算，产生一个数组作为输出。

索引、分片和迭代

1、一维数组可以进行索引、分片和迭代，类似于列表和python中的其他序列。

2、多维数组中每一个轴有一个索引，可以使用多个索引。当给定的索引数目比数组的维度小时，其他丢失索引的维度上被认为是访问整片。例如对于一个二维数组B，B[1]与B[1,:]相同，即访问第一行的所有元素。也可以在索引中写省略号，下面的这些写法效果是相同的：x[1,2,...]和x[1,2,:,:,:]；x[...,3]和x[:,:,:,:,3]；x[4,...,5,:]和 x[4,:,:,5,:]。

3、多维数组的迭代在数组的第一个轴上进行，例如：B[[0,1,2,3],[4,5,6,7]]，for row in B:print(row)，打印结果是逐行打印的。

4、可以使用flat属性来逐个访问数组中的元素，B.flat是一个遍历B中所有元素的迭代器。

形状操作

1、改变数组的形状有多种方法，下面这三种方法返回一个经过修改的数组，但原数组未发生改变。ravel()方法返回一个展开的一维数组；reshape()方法返回一个修改过的数组，在这个方法中需要指定改变后的形状，即每一维度上的长度，改变形状后数组的元素个数不能发生改变，否则会报错；T属性，返回数组的转置。

2、 resize()函数返回经过修改的数组，但不是创建一个新的数组，而是在原数组上改变。

3、 reshape()函数中如果指定一个参数为-1，则这个维度的长度会自动计算。

拷贝和视图

1、完全不拷贝：简单的赋值不会拷贝数组对象和它们的数据；

2、视图和浅拷贝：视图方法会创建一个新数组对象，这个新对象看向原数组中的数据，对创建的这个新对象变换形状不会改变原数组的形状，但是由于新对象和原数组对象共享相同的数据，因此如果对新数组对象中的元素做更改，原数组中的元素也会发生相应的改变；

3、深拷贝：完全复制原数组及其数据，这是两个不同的数组，对新数组做的任何操作都不会影响到原数组。

广播规则

每一个通用函数以数组作为输入，通过逐元素的运算输出一个数组。标准的广播规则被应用到不同形状的输入数组，这样这些不同形状的输入数组就可以进行运算了。广播的四个规则：

1、维度较小的数组会在前面追加一个长度为 1 的维度。

2、输出数组的每个维度的大小是输入数组该维度大小的最大值。

3、如果输入在每个维度中的大小与输出大小匹配，或其值正好为 1，则在计算中可它。

4、如果输入的某个维度大小为 1，则该维度中的第一个数据元素将用于该维度的所有计算。

如果一些数组经过上面的规则广播后可以产生有效的结果，那么这些数组就是可被广播的，例如：

1、所有的数组拥有相同的形状；

2、所有的数组有相同的维度，并且每一个维度的长度是相同的或者是1；

3、维度太少的数组可以通过追加维度并使追加维度的长度为1；

索引技巧

1、使用索引数组进行索引，当被索引的数组是一个多维数组时，单值索引会指向数组的第一个维度；

2、我们也可以在多个维度上进行索引，此时这多个索引数组的形状必须是相同的(P19)，只需将这多个数组写成列表的形式即可索引；

3、 argmax()方法可以取出数组中的最大值的索引，在方法中可以指定轴，沿着某一个方向去寻找最大值；

4、使用数组索引进行赋值，但是当索引中有重复的值时，元素会被重复赋值，元素最终的结果是最后一次赋值的结果；

5、使用布尔型数组索引，布尔型索引用的较多的是与原数组有着相同形状这样的数组，使用这样的布尔型索引数组可以挑选原数组中的一些值并进行操作，如访问、赋值、；我们也可以使用一维的布尔型数组来选取数组中我们想要的部分；需要注意的是，这个一维数组的长度必须要和待选取的数组相应维度一致；

6、 ix_()：接收n个一维数组作为输入，这n个数组的形状可以不同，其输出为一个元组，元组的元素个数为n，每一个元素都是一个n维数组；假设输入的第k个一维数组的长度为m，那么这个数组的形状为(1,1,…,m,…1)，即第k个维度的长度为m，其他维度上的长度为1；

线性代数

Numpy中含有线性代数模块，可以很方便地使用它来进行矩阵计算。

其他

1、数组形状变换时，可以将其中的一个维度的长度指定为-1，程序会自动计算这个维度的长度；

2、可以使用numpy绘制直方图，对于给定的一个数组，使用histogram()函数后会返回一组向量，一个是直方图，另一个是bins。关于bins的官方文档解释是这样的：if bins is an int, it defines the number of equal-width bins in the given range (10, by default). If bins is a sequence, it defines the bin edges, including the rightmost edge, allowing for non-uniform bin widths.在matplotlib中也有绘制直方图的功能，但是numpy中的功能与之是由区别的，区别在于：matplotlib会自动绘制直方图，而numpy不会，需要我们使用matplotlib中的命令来绘制直方图。

相关推荐