- 一、Python数据分析概述
- 二、Numpy数值计算基础
- 1、 numpy的数组对象ndarray
- (1)创建数组
- (2)查看数组属性
- (3)专门创建数组的函数
- (4)数组的数据类型
数据分析是指用适当的分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和总结概括的过程. 广义的数据分析包括狭义数据分析和数据挖掘。 狭义的数据分析是指根据数据分析目的,采用对比分析、分组分析、交叉分析和回归分析等分析方法,对收集的数据进行处理与分析,提取有信息,得到特征统计计量结果的过程。 数据挖掘是从大量的、不完全的、有噪声的实际应用数据中,通过应用聚类模型、分类模型、回归和关联规则等技术,挖掘潜在价值的过程。二、Numpy数值计算基础 1、 numpy的数组对象ndarray
Python的array模块不支持多维,numpy提供的存储单一数据类型的多维数组——ndarray可以弥补其不足。(1)创建数组
一维:
import numpy as np #导入numpy库
arr1 = np.array([1,2,3,4])
print('创建的数组为:n',arr1)
二维:
#前面已经导入过库,此后不再导入
arr2 = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10])
print('创建的数组为:n',arr2)
(2)查看数组属性
print('数组维度为:',arr2.shape) #查看数据结构
print('数组类型为:',arr2.dtype) #查看数组类型
print('数组元素个数为:',arr2.size) #查看数组元素的个数
print('数组每个元素大小为:',arr2.itemsize) #查看数组每个元素大小
(3)专门创建数组的函数
arange:
#arange是专门用来创建数组的函数
#通过指定开始值、终值和步长,创建的数组不含终值
print('使用arange函数创建的数组为:n',np.arange(0,1,0.1))
#即从0-1,间隔为0.1
linspace:
#linspace指定开始值、终值和元素个数创建数组 包括终值
print('使用logspace函数创建的数列为:',np.logspace(0,2,10))
zero:
#zero用来创建全为0的数组
print('使用zeros函数创建的数组为:n',np.zeros((2,3)))
eye:
#eye用来创建主对角线上元素为1的数组,类似于单位矩阵
print('使用eye创建的数组为:n',np.eye(3))
ones:
print('使用ones函数创建元素全为1的数组为:n',np.ones((5,3)))
(4)数组的数据类型
| 类型 | 描述 |
|---|---|
| bool | 布尔类型(True 或者False) |
| inti | 由所在平台决定精度的整数(一般为int32或者int64) |
| int32 | 整数 |
| int64 | 整数 |
| float32 | 单精度浮点数(32位) |
| float64 | 双精度浮点数(64位) |
类型转换举例;
#整型转换成浮点型: print(np.float64(42)) #整型转换成布尔型: print(np.bool(42))



