NumPy 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy 是一个运行速度非常快的数学库,主要用于数组计算,主要功能包括线性代数、傅里叶变换、随机数生成等功能。底层核心是ndarray。
Numpy特点- 代码更简洁:Numpy直接以数组、矩阵为粒度进行计算,并且支持大量的数学函数;
- 性能更高效:Numpy底层采用C语言实现、释放了GIL锁、算法更先进;
- 是其他数据科学库的基础:Numpy是Pandas、SciPy、Scikit-Learn、Tensorflow等库的基础
pip install numpy pip install numpy -i https://pypi.douban.com/simple/
若pip安装不成功可以通过wheel方式安装
# whl文件名称是:numpy-1.21.1-cp38-cp38-win_amd64.whl,若安装不成功,将其名称改为numpy-1.21.1-cp38-none-win_amd64.whl pip install numpy-1.21.1-cp38-cp38-win_amd64.whl pip install numpy-1.21.1-cp38-none-win_amd64.whl
获取当前版本
import numpy as np print(np.__version__)
获取帮助信息
import numpy as np print(help(np.info(np.random.rand)))ndarray对象
NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。
ndarray特点
- ndarray 对象是用于存放同类型元素的多维数组
- ndarray 中的每个元素在内存中都有相同存储大小的区域
ndarray内部结构
- 一个指向数据(内存或内存映射文件中的一块数据)的指针。
- 数据类型或 dtype,描述在数组中的固定大小值的格子。
- 一个表示数组形状(shape)的元组,表示各维度大小的元组。
- 一个跨度元组(stride),其中的整数指的是为了前进到当前维度下一个元素需要"跨过"的字节数。
import numpy as np
import time
def sum(n):
param1 = [i ** 2 for i in range(n)]
param2 = [i ** 3 for i in range(n)]
result = []
for i in range(n):
result.append(param1[i] + param2[i])
return result
time_begin = time.time()
sum(1000000)
time_end = time.time()
print(time_end - time_begin) # 622ms
def sum1(n):
param1 = np.arange(n) **2
param2 = np.arange(n) **3
return param1 + param2
time_start = time.time()
sum1(1000000)
time_stop = time.time()
print(time_stop - time_start) # 9ms
Numpy基本操作
创建数组
array函数
import numpy as np np.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)
| 参数 | 描述 |
|---|---|
| object | 数组或嵌套的数列 |
| dtype | 数组元素的数据类型,可选 |
| copy | 对象是否需要复制,可选 |
| order | 创建数组的样式,C为行方向,F为列方向,A为任意方向(默认) |
| subok | 默认返回一个与基类类型一致的数组 |
| ndmin | 指定生成数组的最小维度 |
import numpy as np arr1 = np.array([1, 2, 3]) print(arr1) # 一维数组 arr2 = np.array([[1, 2, 3], [4, 5, 6]]) print(arr2) # 二维数组 arr3 = np.array([[[1, 2], [3, 4]], [[1, 2], [3, 4]]]) print(arr3) # 三维数组 # 通过指定维数(ndim)创建数组 arr4 = np.array([1, 2, 3, 4, 5], ndmin=2) print(arr4) # [[1 2 3 4 5]]
python列表创建数组
import numpy as np num_list = [4, 5, 6, 7] result = np.array(num_list) print(result) # [4 5 6 7] print(type(result)) #print(result.size) # 4 print(result.shape) # (4,)
python元组创建数据
import numpy as np num_list = (4, 5, 6, 7) result = np.array(num_list) print(result) # [4 5 6 7] print(type(result)) #print(result.size) # 4 print(result.shape) # (4,)
python集合创建数组
import numpy as np
# 采用集合创建numpy数组时,将集合整体作为数组的一个元素
num_list = {4, 5, 6, 7}
result = np.array(num_list)
print(result) # {4, 5, 6, 7}
print(type(result)) #
print(result.size) # 1
print(result.shape) # ()
字典创建数组
import numpy as np
# 采用字典创建numpy数组时,将字典整体作为数组的一个元素
dic_list = {
"name": "Mary",
"age": 18
}
result3 = np.array(dic_list)
print(result3) # {'name': 'Mary', 'age': 18}
print(type(result3)) #
print(result3.size) # 1
print(result3.shape) # ()
通过集合和字典创建时属性值与预期不同。通常numpy与list结合使用
数据类型dtype
| 名称 | 描述 |
|---|---|
| bool_ | 布尔型数据类型(True 或者 False) |
| int_ | 默认的整数类型(类似于 C 语言中的 long,int32 或 int64) |
| intc | 与 C 的 int 类型一样,一般是 int32 或 int 64 |
| intp | 用于索引的整数类型(类似于 C 的 ssize_t,一般情况下仍然是 int32 或 int64) |
| int8 | 字节(-128 to 127) |
| int16 | 整数(-32768 to 32767) |
| int32 | 整数(-2147483648 to 2147483647) |
| int64 | 整数(-9223372036854775808 to 9223372036854775807) |
| uint8 | 无符号整数(0 to 255) |
| uint16 | 无符号整数(0 to 65535) |
| uint32 | 无符号整数(0 to 4294967295) |
| uint64 | 无符号整数(0 to 18446744073709551615) |
| float_ | float64 类型的简写 |
| float16 | 半精度浮点数,包括:1 个符号位,5 个指数位,10 个尾数位 |
| float32 | 单精度浮点数,包括:1 个符号位,8 个指数位,23 个尾数位 |
| float64 | 双精度浮点数,包括:1 个符号位,11 个指数位,52 个尾数位 |
| complex_ | complex128 类型的简写,即 128 位复数 |
| complex64 | 复数,表示双 32 位浮点数(实数部分和虚数部分) |
| complex128 | 复数,表示双 64 位浮点数(实数部分和虚数部分) |
默认类型
import numpy as np num_list = np.array([3, 5, 6, 8]) print(num_list.dtype) # int32 num_list1 = np.array([4.5, 2.4, 7.5]) print(num_list1.dtype) # float64 num_list2 = np.array([1 + 3j, 3 + 5j]) print(num_list2.dtype) # complex128
Numpy整形、浮点型、复数默认的值为int32、float64、complex128
指定类型创建数组
import numpy as np arr = np.array([1, 2, 3, 4], dtype=bool) print(arr) # [ True True True True] arr1 = np.array([1, 2, 3, 4], dtype=np.float32) arr1_1 = np.array([1, 2, 3, 4], dtype=float) print(arr1) # [1. 2. 3. 4.] print(arr1_1) # [1. 2. 3. 4.] arr2 = np.array([1, 2, 3, 4], dtype=str) print(arr2) # ['1' '2' '3' '4'] arr3 = np.array([1, 2, 3, 4], dtype=np.complex64) print(arr3) # [1.+0.j 2.+0.j 3.+0.j 4.+0.j] arr4 = np.array([1, 2, 3.5, '4'], dtype=object) print(arr4) # [1 2 3.5 '4']
通过指定类型创建数组时,np.int32与int等价;np.float64与float等价;np.complex128与complex等价。
Ndarray中的数据必须是同一类型,否则会自动向下转换。int -> float -> str
import numpy as np arr1 = np.array([1,2,3,4,'5']) print(arr1) # ['1' '2' '3' '4' '5'] arr2 = np.array([1,2,3,4,5.0]) print(arr2) # [1. 2. 3. 4. 5.]数组属性
| 属性 | 描述 |
|---|---|
| dtype | 数据类型 |
| ndim | 维度数量或轴的数量 |
| shape | 维度或形状(行,列) |
| size | 元素个数 |
| itemsize | 元素字节数 |
| nbytes | 数组总共字节数 (nbytes = size * itemsize) |
数组属性操作
import numpy as np # 一维数组 arr1 = np.array([4, 5, 6]) print(type(arr1)) #print(arr1.dtype) # int32 print(arr1.size) # 3 print(arr1.ndim) # 1 print(arr1.shape) # (3,) print(arr1.itemsize) # 4 (整形占4个字节) print(arr1.nbytes) # 12 # 二维数组 arr2 = np.array([[1, 2, 3], [4, 5, 6]]) print(type(arr2)) # print(arr2.dtype) # int32 print(arr2.size) # 6 print(arr2.ndim) # 2 print(arr2.shape) # (2, 3) print(arr2.itemsize) # 4 (整形占4个字节) print(arr2.nbytes) # 24
shape()函数以元组的形式返回数组的形状,若数组是一维的,返回数组元素个数
改变数组维度
import numpy as np arr = np.array([3, 5, 8, 5, 3, 7, 6, 3, 7]) print(arr) # [3 5 8 5 3 7 6 3 7] tar = arr.reshape(3, 3) print(tar) ''' [[3 5 8] [5 3 7] [6 3 7]] ''' # ndarray.reshape 通常返回的是非拷贝副本,即改变返回后数组的元素,原数组对应元素的值也会改变。 tar[1, 1] = 100 print(arr) # [3 5 8 5 100 7 6 3 7] print(tar) ''' [[ 3 5 8] [ 5 100 7] [ 6 3 7]] '''数组访问
索引访问
import numpy as np arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) print(arr[1, 1]) # 5 print(arr[1][1]) # 5 print(arr[1]) # [4 5 6] 访问数组第二行 print(arr[:,1]) # [2,5,8] 访问数组第二列
切片访问
一维数组
import numpy as np arr = np.array([4, 5, 6, 7, 8, 9]) print(arr[1:3]) # [5 6] print(arr[-2:]) # [8 9] print(arr[:-2]) # [4 5 6 7] print(arr[::]) # [4 5 6 7 8 9] print(arr[::-1]) # [9 8 7 6 5 4] print(arr[0:len(arr):3]) # [4, 7]
切片arr(begin, end, step),其中范围为[begin, end)
二维数组
import numpy as np
arr = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(arr[:1]) # [[1 2 3 4]]
print(arr[1, 1:3]) # [6,7]
'''
arr[:2] 结果为:
[
[1 2 3 4]
[5 6 7 8]
]
arr[:, :2]结果为:
[
[ 1 2]
[ 5 6]
[ 9 10]
]
'''
print(arr[:2])
print(arr[:, :2])
n维数组切片访问返回的是n维数组
高级索引访问
通过布尔类型数组作为索引进行数据过滤
import numpy as np arr = np.array([1, 2, 3, 4]) bool_arr = np.array([0, 1, 1, 0], dtype=bool) print(bool_arr) # [False True True False] result = arr[bool_arr] print(result) # [2 3]
通过过滤条件访问
import numpy as np arr = np.array([1, 2, 3, 4]) mask = arr > 2 print(mask) # [False False True True] print(arr[mask]) # [3 4] arr1 = arr[arr > 2] print(arr1) # [3 4]
通过传递判断条件进行数据过滤,其本质还是传递了一个布尔类型的ndarray数组
通过传递索引值过滤数据
import numpy as np arr1 = np.array([1, 2, 3, 4]) print(np.where(arr1)) # (array([0, 1, 2, 3], dtype=int64),) 返回索引 print(np.where(arr1 > 2)) # (array([2, 3], dtype=int64),) print(arr1[np.where(arr1 > 2)]) # [3 4]
通过传递判断条件进行数据过滤,其本质是传递了一个包含满足条件索引的ndarray数组
赋值访问
采用直接赋值方法,一改全改
import numpy as np arr1 = np.array([1, 2, 3, 4]) arr2 = arr1 arr2[1] = 100 print(arr1) # [1 100 3 4] print(arr2) # [1 100 3 4]
采用copy()赋值彼此独立
arr1 = np.array([1, 2, 3, 4]) arr2 = arr1.copy() arr2[1] = 100 print(arr1) # [1 2 3 4] print(arr2) # [1 100 3 4]
遍历数组
通过nditer()进行遍历
import numpy as np
# 获取所有数据
arr = np.array([[9, 8, 7], [6, 5, 4], [3, 2, 1]])
for val in np.nditer(arr):
print(val, end=",") # 9,8,7,6,5,4,3,2,1,
# 获取部分数据
arr = np.array([[9, 8, 7], [6, 5, 4], [3, 2, 1]])
for val in np.nditer(arr[1]):
print(val, end=",") # 6,5,4,
通过ndenumerate()进行遍历
import numpy as np
arr = np.array([[9, 8, 7], [6, 5, 4], [3, 2, 1]])
for index,value in np.ndenumerate(arr):
print(index,value)
'''
(0, 0) 9
(0, 1) 8
(0, 2) 7
(1, 0) 6
(1, 1) 5
(1, 2) 4
(2, 0) 3
(2, 1) 2
(2, 2) 1
'''
设置矩阵不可修改
import numpy as np # numpy数组值默认可修改 arr = np.array([1, 9, 3, 4]) arr1 = arr arr[1] = 30 print(arr) # [1 30 3 4] print(arr1) # [1 30 3 4] # 通过writeable属性可设置数组值不可变 arr1 = np.array([1, 2, 3, 4, 5]) arr1.flags.writeable = False arr1[0] = 1 # 报错数组生成函数
asarray()
import numpy as np arr = np.array([1, 2, 3, 4]) tar = np.asarray(arr, dtype=np.float32) print(arr) # [1 2 3 4] (不改变原始值) print(tar) # [1. 2. 3. 4.]
astype创建
import numpy as np arr = np.array([1, 2, 3, 4]) tar = arr.astype(np.float32) print(arr) # [1 2 3 4] (不改变原始值) print(tar) # [1. 2. 3. 4.]
fill创建
import numpy as np alist = np.array([4, 5, 6, 7]) alist.fill(7) print(alist) # [7 7 7 7]
| 函数 | 描述 |
|---|---|
| arange(start, stop, step, dtype) | 根据范围和步长创建等差数组 |
| linspace(start, stop, num, endpoint, retstep, dtype) | 根据范围和个数创建等差数组 |
| logspace(start, stop, num, endpoint, base, dtype) | 根据范围和个数创建等比数组 |
arange(start, stop, step, dtype)
| 参数 | 描述 |
|---|---|
| start | 起始值,默认为0 |
| stop | 终止值(不包含) |
| step | 步长,默认为1 |
| dtype | 返回ndarray的数据类型,如果没有提供,则会使用输入数据的类型。 |
import numpy as np print(np.arange(10)) # [0 1 2 3 4 5 6 7 8 9] print(np.arange(2, 10, 2)) # [2 4 6 8] print(np.arange(2, 20, 2, dtype=float)) # [ 2. 4. 6. 8. 10. 12. 14. 16. 18.]
linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
| 参数 | 描述 |
|---|---|
| start | 序列的起始值 |
| stop | 序列的终止值,如果endpoint为True,该值包含于数列中 |
| num | 要生成的等步长的样本数量,默认为50 |
| endpoint | 该值为 True时,数列中包含stop值,反之不包含,默认是True。 |
| retstep | 如果为 True时,生成的数组中会显示间距,反之不显示。 |
| dtype | ndarray的数据类型 |
import numpy as np print(np.linspace(2, 3, num=5)) # [2. 2.25 2.5 2.75 3. ] print(np.linspace(2, 3, num=5, endpoint=False)) # [2. 2.2 2.4 2.6 2.8] print(np.linspace(2, 3, num=5, retstep=True)) # (array([2. , 2.25, 2.5 , 2.75, 3. ]), 0.25) print(np.linspace(1, 1, 10)) # [1. 1. 1. 1. 1. 1. 1. 1. 1. 1.] print(np.linspace(1, 1, 10, retstep=True)) # (array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]), 0.0)
arange()和linspace()区别在于:前者是根据范围和步长生成等差数组;后者是通过范围和个数生成等差数组
np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)
| 参数 | 描述 |
|---|---|
| start | 序列的起始值为:base ** start |
| stop | 序列的终止值为:base ** stop。如果endpoint为True,该值包含于数列中 |
| num | 要生成的等步长的样本数量,默认为50 |
| endpoint | 该值为 True 时,数列中中包含stop值,反之不包含,默认是True |
| base | 对数 log 的底数,即取对数的时候 log 的下标 |
| dtype | ndarray的数据类型 |
import numpy as np print(np.logspace(0, 3, 4)) # [ 1. 10. 100. 1000.] print(np.logspace(0, 5, 6, base=2)) # [ 1. 2. 4. 8. 16. 32.]
| 函数 | 描述 |
|---|---|
| empty(shape, dtype = float, order = ‘C’) | 创建一个指定形状、数据类型且未初始化的数组 |
| zeros(shape, dtype = float, order = ‘C’) | 创建指定大小的数组,数组元素以 0 来填充 |
| ones(shape, dtype = None, order = ‘C’) | 创建指定形状的数组,数组元素以 1 来填充 |
| identity(n, dtype=None, *, like=None) | 创建对角矩阵,只能是方阵 |
| eye(N, M, k, dtype, order, *, like) | 创建对角矩阵,可以为非方阵 |
函数参数含义
| 参数 | 描述 |
|---|---|
| shape | 数组形状 |
| dtype | 数据类型,可选 |
| order | 有"C"和"F"两个选项,分别代表,行优先和列优先,在计算机内存中的存储元素的顺序。 |
empty()
import numpy as np print(np.empty(3)) # 一维未初始化数组 print(np.empty((3, 3))) # 二维未初始化数组 print(np.empty((3, 3), dtype=np.int16)) # 指定类型的二维空数组 ''' 运行结果为: [0. 0.5 1. ] [[6.23042070e-307 4.67296746e-307 1.69121096e-306] [1.86921822e-306 1.29057407e-306 1.24611741e-306] [1.11261027e-306 2.07955588e-312 7.27378088e+175]] [[ 0 0 0] [ 0 5200 -29400] [ 32761 0 5200]] '''
empty() 返回一个一维或者多维数组,数组的元素不为空,为随机产生的数据。
zeros()
import numpy as np print(np.zeros(5)) print(np.zeros((4, 4))) print(np.zeros((4, 4), dtype=np.int32)) ''' 返回结果为: [0. 0. 0. 0. 0.] [[0. 0. 0. 0.] [0. 0. 0. 0.] [0. 0. 0. 0.] [0. 0. 0. 0.]] [[0 0 0 0] [0 0 0 0] [0 0 0 0] [0 0 0 0]] '''
ones()
import numpy as np print(np.ones(5)) print(np.ones((4, 4))) print(np.ones((4, 4), dtype=np.int32)) ''' 返回结果为: [1. 1. 1. 1. 1.] [[1. 1. 1. 1.] [1. 1. 1. 1.] [1. 1. 1. 1.] [1. 1. 1. 1.]] [[1 1 1 1] [1 1 1 1] [1 1 1 1] [1 1 1 1]] '''
identity()
import numpy as np # 默认类型为浮点型 arr = np.identity(3) print(arr) # 指定类型创建 arr1 = np.identity(3, dtype=np.int32) print(arr1)
identity只能创建方阵
*eye(N, M=None, k=0, dtype=float, order=‘C’, , like=None)
| 参数 | 描述 |
|---|---|
| N,M | 指定矩阵的shape,若M省略,则创建方阵,功能同identity() |
| k | 对角线的下标,默认为0表示的是主对角线,负数表示的是低对角,正数表示的是高对角 |
| dtype | 数据类型,默认float |
| order | 有"C"和"F"两个选项,分别代表,行优先和列优先,在计算机内存中的存储元素的顺序。 |
import numpy as np
print(np.eye(3))
'''
[[1. 0. 0.]
[0. 1. 0.]
[0. 0. 1.]]
'''
arr = np.eye(3,4,k=1)
print(arr)
arr2 = np.eye(3,4,k=2)
print(arr2)
arr3 = np.eye(3,4,k=-1)
print(arr3)
arr4 = np.eye(3,4,k=-2)
print(arr4)
'''
k=1 k=2 k=-1 k=-2
[[0. 1. 0. 0.] [[0. 0. 1. 0.] [[0. 0. 0. 0.] [[0. 0. 0. 0.]
[0. 0. 1. 0.] [0. 0. 0. 1.] [1. 0. 0. 0.] [0. 0. 0. 0.]
[0. 0. 0. 1.]] [0. 0. 0. 0.]] [0. 1. 0. 0.]] [1. 0. 0. 0.]]
'''
zeros_like() / ones_like()
# 根据已有 import numpy as np arr = np.array([3, 4, 5, 6]) print(np.zeros_like(arr)) # [0 0 0 0] print(np.ones_like(arr)) # [1 1 1 1] arr1 = np.array([[1, 2, 3], [4, 5, 6]]) print(np.zeros_like(arr1)) print(np.ones_like(arr1))数值计算 四则运算
| 函数 | 描述 |
|---|---|
| add() | + | 加法 |
| subtract() | - | 减法 |
| multiply() | * | 乘法 |
| divide() | / | 除法 |
Numpy支持数组之间的四则运算。
import numpy as np arr1 = np.array([10, 20, 30]) arr2 = np.array([1, 2, 3]) # 加法 print(np.add(arr1, arr2)) # [11 22 33] print(arr1 + arr2) # [11 22 33] # 减法 print(np.subtract(arr1, arr2)) # [9 18 27] print(arr1 - arr2) # [9 18 27] # 乘法 print(np.multiply(arr1, arr2)) # [10 40 90] print(arr1 * arr2) # [10 40 90] # 除法 print(np.divide(arr1, arr2)) # [10. 10. 10.] print(arr1 / arr2) # [10. 10. 10.]
比较运算推荐使用四则运算符实现size运算,书写简单。
import numpy as np arr1 = np.array([1, 20, 3]) arr2 = np.array([1, 2, 3]) print(arr1 == arr2) # [True False True]逻辑运算
import numpy as np arr1 = np.array([1, 2, 3]) arr2 = np.array([5, 0, 4]) print(np.logical_and(arr1, arr2)) # [ True False True] print(np.logical_or(arr1, arr2)) # [ True True True] print(np.logical_not(arr1)) # [False False False] print(np.logical_not(arr2)) # [False True False] print(np.logical_xor(arr1, arr2)) # [False True False]Numpy函数 轴 数学函数
| 函数 | 描述 |
|---|---|
| sin() | 正弦(参数单位为弧度) |
| cos() | 余弦(参数单位为弧度) |
| tan() | 正切(参数单位为弧度) |
| arcsin() | 反正弦(返回值单位为弧度) |
| arccos() | 反余弦(返回值单位为弧度) |
| arctan() | 反正弦(返回值单位为弧度) |
| degrees() | 将弧度转换为角度 |
sin()/arcsin()
import numpy as np
arr = np.array([0, 30, 45, 60, 90])
print('含有正弦值的数组:')
sin = np.sin(arr * np.pi / 180)
print(sin) # [0. 0.5 0.70710678 0.8660254 1.]
print('计算角度的反正弦,返回值以弧度为单位:')
inv = np.arcsin(sin)
print(inv) # [0. 0.52359878 0.78539816 1.04719755 1.57079633]
print('通过转化为角度制来检查结果:')
print(np.degrees(inv)) # [0. 30. 45. 60. 90.]
cos()/arccos()
import numpy as np
arr = np.array([0, 30, 45, 60, 90])
print('arccos:')
cos = np.cos(arr * np.pi / 180)
print(cos) # [1.00000000e+00 8.66025404e-01 7.07106781e-01 5.00000000e-01 6.12323400e-17]
print('反余弦:')
inv = np.arccos(cos)
print(inv) # [0. 0.52359878 0.78539816 1.04719755 1.57079633]
print('角度制单位:')
print(np.degrees(inv)) # [0, 30, 45, 60, 90]
tan()/arctan()
import numpy as np
arr = np.array([0, 30, 45, 60, 90])
print('tan 函数:')
tan = np.tan(arr * np.pi / 180)
print(tan) # [0.00000000e+00 5.77350269e-01 1.00000000e+00 1.73205081e+00 1.63312394e+16]
print('反正切:')
inv = np.arctan(tan)
print(inv) # [0. 0.52359878 0.78539816 1.04719755 1.57079633]
print('角度制单位:')
print(np.degrees(inv)) # [0, 30, 45, 60, 90]
| 函数 | 描述 |
|---|---|
| around(arr,decimals) | 四舍五入(decimals为小数位数) |
| floor() | 向下取整 |
| ceil() | 向上取整 |
around(arr,decimals)
import numpy as np
arr = np.array([1.0, 5.55, 123, 0.567, 25.532])
print('原数组:')
print(arr) # [1. 5.55 123. 0.567 25.532]
print('舍入后:')
print(np.around(arr)) # [1. 6. 123. 1. 26.]
print(np.around(arr, decimals=1)) # [1. 5.6 123. 0.6 25.5]
print(np.around(arr, decimals=-1)) # [0. 10. 120. 0. 30.]
如果decimals为负,整数将四舍五入到小数点左侧的位置
floor()
import numpy as np arr = np.array([-1.7, 1.5, -0.2, 0.6, 10]) print(arr) # [-1.7 1.5 -0.2 0.6 10.] print(np.floor(arr)) # [-2. 1. -1. 0. 10.]
ceil()
import numpy as np arr = np.array([-1.7, 1.5, -0.2, 0.6, 10]) print(arr) # [-1.7 1.5 -0.2 0.6 10.] print(np.ceil(arr)) # [-1. 2. -0. 1. 10.]算数函数
| 函数 | 描述 |
|---|---|
| reciprocal() | 返回元素倒数 |
| power() | 幂指数 |
| mod() | 余数 |
reciprocal()
import numpy as np arr = np.array([10, 20, 30]) print(arr) # [10 20 30] print(np.reciprocal(arr)) # [0 0 0] arr2 = np.array([10, 20, 30], dtype=np.float32) print(arr2) # [10. 20. 30.] print(np.reciprocal(arr2)) # [0.1 0.05 0.03333334]
采用reciprocal()求取倒数时,元素必须是浮点型的
pow()
import numpy as np # pow()将第一个输入数组中的元素作为底数,计算它与第二个输入数组中相应元素的幂 arr = np.array([10, 100, 1000]) print(arr) # [10 100 1000] print(np.power(arr, 2)) # [100 10000 1000000] print(arr ** 2) # [100 10000 1000000] (推荐) pows = np.array([1, 2, 3]) print(pows) # [1 2 3] print(np.power(arr, pows)) # [10 10000 1000000000]
mod()
arr = np.array([10, 20, 30]) param = np.array([3, 5, 7]) print(arr) # [10 20 30] print(param) # [3 5 7] print(np.mod(arr, param)) # [1 0 2] print(arr % param) # [1 0 2] (推荐)统计函数
| 函数 | 描述 |
|---|---|
| sum | 求和(返回一维ndarray数组) |
| prod | 求积(返回一维ndarray数组) |
| cumsum | 求累计和(返回值与原数组维度相同) |
| cumprod | 求累计乘积(返回值与原数组维度相同) |
| min() | 计算数组中的元素沿指定轴的最小值(返回一维ndarray数组) |
| max() | 计算数组中的元素沿指定轴的最大值(返回一维ndarray数组) |
| argmin() | 返回最小值索引(返回一维ndarray数组) |
| argmax() | 返回最大值索引(返回一维ndarray数组) |
sum()
import numpy as np # 求数组所有元素的和 num_list = np.array([[1, 2, 3], [4, 5, 6]]) print(num_list.sum()) # 21 print(np.sum(num_list)) # 21 # 按轴进行求和 print(num_list.sum(0)) # [5 7 9] print(np.sum(num_list, 0)) # [5 7 9] print(num_list.sum(1)) # [6 15] print(np.sum(num_list, axis=1)) # [6 15] print(np.sum(num_list, axis=-1)) # [6 15] 按最后一个轴进行累加
prod()
import numpy as np # 求数组所有元素的积 num_list = np.array([[1, 2, 3], [4, 5, 6]]) print(num_list.prod()) # 720 print(np.prod(num_list)) # 720 # 按轴进行求积 print(num_list.prod(0)) # [4 10 18] print(np.prod(num_list, 0)) # [4 10 18] print(num_list.prod(1)) # [6 120] print(np.prod(num_list, axis=1)) # [6 120] print(np.prod(num_list, axis=-1)) # [6 120] 按最后一个轴进行累乘
cumsum()
import numpy as np # 计算累积和 arr = np.array([[1, 2, 3], [4, 5, 6]]) ''' [[1 2 3] [4 5 6]] ''' print(arr) print(np.cumsum(arr)) # [1 3 6 10 15 21] print(np.cumsum(arr, dtype=float)) # [1. 3. 6. 10. 15. 21.] ''' [[1 2 3] [5 7 9]] ''' print(arr.cumsum(axis=0)) ''' [[ 1 3 6] [ 4 9 15]] ''' print(arr.cumsum(axis=1))
cumprod()
import numpy as np # 计算累积乘积 arr = np.array([[1, 2, 3], [4, 5, 6]]) ''' [[1 2 3] [4 5 6]] ''' print(arr) print(np.cumprod(arr)) # [1 2 6 24 120 720] print(np.cumprod(arr, dtype=float)) # [1. 2. 6. 24. 120. 720.] ''' [[ 1 2 3] [ 4 10 18]] ''' print(arr.cumprod(axis=0)) ''' [[ 1 2 6] [ 4 20 120]] ''' print(arr.cumprod(axis=1))
min()
import numpy as np # 求数组所有元素最小值 arr = np.array([[1, 2, 3], [4, 5, 6]]) print(np.min(arr)) # 1 # 按轴计算最小值 print(np.min(arr, axis=0)) # [1 2 3] print(arr.min(axis=1)) # [1 4]
max()
import numpy as np # 求数组所有元素最大值 arr = np.array([[1, 2, 3], [4, 5, 6]]) print(np.max(arr)) # 6 # 按轴计算最大值 print(np.max(arr, axis=0)) # [4 5 6] print(arr.max(axis=1)) # [3 6]
argmin()
import numpy as np # 求数组所有元素最小值的索引 arr = np.array([[9, 1, 30], [4, 5, 6]]) print(arr.argmin()) # 1 # 按轴计算数组元素最小值的索引 print(arr.argmin(axis=0)) # [1 0 1] print(arr.argmin(axis=1)) # [1,0]
argmax()
import numpy as np # 求数组所有元素最大值的索引 arr = np.array([[9, 1, 30], [4, 5, 6]]) print(arr.argmax()) # 2 # 按轴计算数组元素最大值的索引 print(arr.argmax(axis=0)) # [0 1 0] print(arr.argmax(axis=1)) # [2 2]
| 函数 | 描述 |
|---|---|
| ptp() | 计算数组中元素最大值与最小值之差 |
| median() | 计算数组中位数 |
| mean() | 计算数组算数平均数 |
| average() | 计算数组元素加权平均值 |
| var() | 计算数组元素方差 |
| std() | 计算数组元素标准差 |
ptp()
import numpy as np # 计算数组中元素最大值与最小值之差 arr = np.array([[3, 7, 5], [-8, 4, 3], [2, 4, 9]]) ''' [[ 3 7 5] [-8 4 3] [ 2 4 9]] ''' print(arr) print(np.ptp(arr)) # 17 # 按轴计算数组中元素最大值与最小值之差 print(np.ptp(arr, axis=1)) # [4 12 7] print(np.ptp(arr, axis=0)) # [11 3 6] print(arr.ptp(axis=-1)) # [4 12 7] 按最后一个轴求取元素最大值与最小值之差
median()
import numpy as np # 计算数组中所有元素的中位数 arr = np.array([[3, 7, 5], [-8, 4, 3], [2, 4, 9]]) ''' [[ 3 7 5] [-8 4 3] [ 2 4 9]] ''' print(arr) print(np.median(arr)) # 4 # 按轴计算数组中元素的中位数 print(np.median(arr, axis=1)) # [5. 3. 4.] print(np.median(arr, axis=0)) # [2. 4. 5.] print(np.median(arr, axis=-1)) # [5. 3. 4.]
平均值
import numpy as np arr = np.array([[1, 2, 3], [4, 5, 6]]) print(np.mean(arr)) # 3.5 print(np.mean(arr, axis=0)) # [2.5 3.5 4.5] print(np.mean(arr, axis=1)) # [2. 5.]
标准差
import numpy as np arr = np.array([[1, 2, 3], [4, 5, 6]]) print(np.std(arr)) # 1.707825127659933 print(np.std(arr, axis=0)) # [1.5 1.5 1.5] print(np.std(arr, axis=1)) # [0.81649658 0.81649658]
方差
import numpy as np arr = np.array([[1, 2, 3], [4, 5, 6]]) print(np.var(arr)) # 2.9166666666666665 print(np.var(arr, axis=0)) # [2.25 2.25 2.25] print(np.var(arr, axis=1)) # [0.66666667 0.66666667]
数值限制
import numpy as np num_list = np.array([1,2,3,4,5,6,7,8]) # 小于3的赋值为3,大于6赋值为6 print(num_list.clip(3,6)) # [3 3 3 4 5 6 6 6]
非0索引
import numpy as np arr = np.array([1, 0, 2, 3, 4, 0, 3, 0]) print(np.nonzero(arr)) # (array([0, 2, 3, 4, 6], dtype=int64),) print(arr.nonzero()) # (array([0, 2, 3, 4, 6], dtype=int64),)
排序操作
import numpy as np arr = np.array([[1.5, 1.3, 7.5], [5.6, 7.8, 1.2]]) print(arr) print(np.sort(arr)) print(np.sort(arr, axis=0)) ''' [[1.5 1.3 7.5] [5.6 7.8 1.2]] [[1.3 1.5 7.5] [1.2 5.6 7.8]] [[1.5 1.3 1.2] [5.6 7.8 7.5]] '''
随机模块排序默认是按最后一个轴进行排序
| 函数 | 描述 |
|---|---|
| rand() | 生成[0, 1)之间的随机小数 |
| randn() | 生成(-∞,+∞)之间的随机小数 |
| random_sample() | 生成[0, 1)之间的随机小数 |
| randint(low, high, size,dtype) | 生成[low,high)之间的随机整数 |
| normal(loc, scale, size) | 生成(-∞,+∞)之间均值为loc,标准差为scale的正态分布 |
随机浮点数
''' rand(d0, d1, ..., dn):生成[0, 1)之间的随机小数,数值来源于均匀分布抽样 random(size=None):生成[0, 1)之间的随机小数,数值来源于均匀分布抽样 randn(d0, d1, ..., dn)生成(-∞,+∞)之间的随机小数,数值来源于标准正态分布抽样 随机小数注意事项: 1. ranf、random、sample、random_sample调用的都是random_sample方法; 2. rand和random_sample效果等价,只是输入参数不同; 3. rand()和randn()都是生成随机小数,区别在于:生成数值的区间不同、分布不同。 ''' import numpy as np print(np.random.rand()) # 返回[0, 1)之间的随机小数 print(np.random.random_sample()) # 返回[0, 1)之间的随机小数 print(np.random.randn()) # 返回(-∞,+∞)之间的随机小数 print(np.random.rand(3,2)) # 返回一个三行两列的矩阵,数值范围[0, 1) print(np.random.random_sample(size=(3,2))) # 返回一个三行两列的矩阵,数值范围[0, 1) print(np.random.randn(3,2)) # 返回一个三行两列的矩阵,数值范围(-∞,+∞)
rand()和randn()都是生成随机小数,区别在于:区间不同、分布不同
随机整数
# randint(low, high=None, size=None, dtype=None) import numpy as np print(np.random.randint(1, 10)) # 产生一个[1,10)之间的随机整数 print(np.random.randint(10)) # 产生一个[0,10)之间的整数(省略high,生成[0,low)之间的随机整数) print(np.random.randint(1, 10, 3)) # 生成三个[1,10)范围内的随机整数 print(np.random.randint(1, 10, size=(3, 3))) # 产生一个3*3矩阵,矩阵数值是[1,10)之间的随机整数 print(np.random.randint(1, high=[3, 5, 10])) # 产生三个上限不同的随机整数 print(np.random.randint([1, 5, 7], 10)) # 产生三个下限不同的随机整数
正态分布
# normal(loc=0.0, scale=1.0, size=None) (均值,标准差,矩阵形状) import numpy as np ''' [[ 0.16360434 1.97129715 -0.72202865 5.54525616] [ 5.30084075 1.16655326 -0.09644836 3.38361816]] ''' print(np.random.normal(3, 2.5, size=(2, 4))) ''' [[ 0.08705979 1.34058832 0.49562195 0.65479645] [-1.41341949 0.90500061 0.14599449 -2.47971539]] ''' print(np.random.normal(size=(2, 4))) ''' [[ 0.222 -0.703 -0.024 1.498] [-0.413 0.283 0.463 -1.421]] ''' np.set_printoptions(precision=3) # 设置打印精度 print(np.random.normal(size=(2, 4)))
洗牌
import numpy as np arr = np.arange(10) print(arr) # [0 1 2 3 4 5 6 7 8 9] np.random.shuffle(arr) print(arr) # [1 0 6 3 2 4 8 9 7 5]
随机种子
# 当指定随机种子后再生成随机数时,每次生成的值都是相同的,不会改变。便于多参数调参时,固定部分参数 import numpy as np np.random.seed(10) arr = np.random.randint(1,10,3) print(arr) # [5 1 2]
高斯分布
import numpy as np np.set_printoptions(precision=3) # 设置打印精度 mu, sigma = 0, 0.1 print(np.random.normal(mu, sigma, 10))文件操作 文件读取
numpy通过loadtxt()读取文本文件
loadtxt(fname, dtype=float, delimiter=None, skiprows=0, usecols=None, max_rows=None)
import numpy as np
# 文件中数据默认空格分隔
arr = np.loadtxt("first.txt")
# 当不是以空格分隔时,需要指定分隔符号
arr2 = np.loadtxt("second.txt",delimiter=",")
# 当存在表头时,可通过skiprows跳过表头行,序号从1开始
arr3 = np.loadtxt("second.txt",delimiter=",",skiprows=1)
# 通过usecols属性可以指定采用哪几列数据构造数组
arr4 = np.loadtxt("second.txt", delimiter=",", skiprows=1, usecols=(1,3))
文件写入
写入txt文件
def savetxt(fname, arr, fmt='%.18e', delimiter=' ', newline='n', header='', footer='', comments='# ', encoding=None):
# 默认分隔符为空格
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6]])
np.savetxt("ff.txt", arr, fmt="%.3f", delimiter=",",header='数学 语文 英语', encoding="utf-8")
读写变量
读/写单一变量
# 单一变量/数组通常保存为npy格式文件
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6]])
np.save("arr.npy", arr) # 存储数组
data = np.load("arr.npy") # 读取数组
print(data) # [[1 2 3] [4 5 6]]
读/写多个变量
# 多个变量/数组通常保存为npz格式文件,其本质是一个压缩格式文件,内容有多个文件与保存的变量相对应
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6]])
arr1 = np.array([3, 4, 5, 6, 7, 8])
np.savez("arr.npz", arr=arr, arr1=arr1) # 存储数组
data = np.load("arr.npz") # 读取数组
print(data['arr']) # [[1 2 3] [4 5 6]]
print(data['arr1']) # [3 4 5 6 7 8]
练习
1、 生成3*3 的二维数组,数组中数范围位[5.0,10.0)
2、
国内
大数据竞赛平台:https://www.datafountain.cn/
阿里天池 : https://tianchi.aliyun.com/
华为云大赛:https://competition.huaweicloud.com/competitions
百度飞桨:https://aistudio.baidu.com/aistudio/index
智源数据开放研究中心:http://competition.baai.ac.cn/home/competition/ongoing
biendata:https://biendata.xyz/
MathorCup高校数学建模挑战赛:http://mathorcup.org/prize
DC竞赛-大数据竞赛平台:https://js.dclab.run/v2/index.html
国外
https://www.kaggle.com/
https://www.drivendata.org/
https://www.crowdanalytix.com/community
https://developer.amazon.com/alexaprize
https://datahack.analyticsvidhya.com/?utm_source=main-logo
https://www.kdd.org/kdd-cup
https://www.innocentive.com/our-solvers/
https://hackx.lk/
https://www.kdd.org/kdd-cup
4, 5, 6]])
np.savetxt(“ff.txt”, arr, fmt=“%.3f”, delimiter=“,”,header=‘数学 语文 英语’, encoding=“utf-8”)
### 读写变量
读/写单一变量
```python
# 单一变量/数组通常保存为npy格式文件
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6]])
np.save("arr.npy", arr) # 存储数组
data = np.load("arr.npy") # 读取数组
print(data) # [[1 2 3] [4 5 6]]
读/写多个变量
# 多个变量/数组通常保存为npz格式文件,其本质是一个压缩格式文件,内容有多个文件与保存的变量相对应
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6]])
arr1 = np.array([3, 4, 5, 6, 7, 8])
np.savez("arr.npz", arr=arr, arr1=arr1) # 存储数组
data = np.load("arr.npz") # 读取数组
print(data['arr']) # [[1 2 3] [4 5 6]]
print(data['arr1']) # [3 4 5 6 7 8]
练习
1、 生成3*3 的二维数组,数组中数范围位[5.0,10.0)
2、
国内
大数据竞赛平台:https://www.datafountain.cn/
阿里天池 : https://tianchi.aliyun.com/
华为云大赛:https://competition.huaweicloud.com/competitions
百度飞桨:https://aistudio.baidu.com/aistudio/index
智源数据开放研究中心:http://competition.baai.ac.cn/home/competition/ongoing
biendata:https://biendata.xyz/
MathorCup高校数学建模挑战赛:http://mathorcup.org/prize
DC竞赛-大数据竞赛平台:https://js.dclab.run/v2/index.html
国外
https://www.kaggle.com/
https://www.drivendata.org/
https://www.crowdanalytix.com/community
https://developer.amazon.com/alexaprize
https://datahack.analyticsvidhya.com/?utm_source=main-logo
https://www.kdd.org/kdd-cup
https://www.innocentive.com/our-solvers/
https://hackx.lk/
https://www.kdd.org/kdd-cup



