Numpy主要是提供数据支持,以及相应的快速处理的函数。
安装
#使用命令行安装:pip install numpy文件名.whl#安装完成
创建数组
Numpy 的主要对象是多维数组 Ndarray。在 NumPy 中维度(dimensions)叫做轴(axes),轴的个数叫做秩(rank)。通过使用numpy.array可以创建数组,但是numpy.array和标准Python库类array.array并不相同,后者只处理一维数组和提供少量功能。
#创建一维数组
np.array([1,2,3])
#通过列表创建二维数组np.array([(1,2,3),(4,5,6)])
#创建全为 0 的二维数组np.zeros((3,3))
#创建全为 1 的三维数组np.ones((2,3,4))
#创建一维等差数组np.arange(5)
数组运算
数组的加减乘除以及指数运算、倒数、相反数、位运算等各类运算都是在各个元素上分别进行的。真正的矩阵乘法采用的是numpy.dot()。
A=np.array([[4,3],[2,1]])
B=np.array([[5,6],[7,8]])
#矩阵加法运算A+B# 矩阵元素间乘法运算A * B
#矩阵乘法运算np.dot(A,B)
#如果使用 np.mat 将二维数组准确定义为矩阵,就可以直接使用 * 完成矩阵乘法计算np.mat(A)*np.mat(B)
#矩阵的转置A.T# 矩阵求逆np.linalg.inv(A)
#数组的方根的运算(开平方)np.sqrt(A)
#数组的方根的运算(立方)np.power(A, 3)
简单的数组统计
numpy可以通过一个函数能够快速的完成一些数理统计。
a = np.array(([1,4,3],[6,2,9],[4,7,2]))
#统计数组各列的中位数np.median(a, axis=0)
#统计数组各行的算术平均值np.mean(a, axis=1)
#统计数组各列的加权平均值np.average(a, axis=0)
#统计数组各行的方差np.var(a, axis=1)
#统计数组各列的标准偏差np.std(a, axis=0)
缺失值删除
用以数据分析的数据并不能保证是完整的,我们常常面临的是存在缺失值的数据,其中一类最简单的缺失处理方式就是直接删除,在用Numpy删除缺失值时,只需要简单一句代码就可以搞定。
#生成含缺失值的 2 维数组Z = np.random.rand(10,10)Z[np.random.randint(10, size=5), np.random.randint(10, size=5)] = np.nanprint(“缺失值总数: n”, np.isnan(Z).sum())print(“缺失值索引: n”, np.where(np.isnan(Z)))
#从随机数组中删除包含缺失值的行Z[np.sum(np.isnan(Z), axis=1) == 0]



