一、认识Dataframe数据结构
Dataframe 是一个表格型的数据结构。它含有一组有序的列。每列可以是不同类型的值,可以看成Dataframe是由Series组成的字典。每一列都是一个Series,这些Series共用同一个索引。Dataframe既有行标签(索引),也有列标签。
注意大小写
:Dataframe
二、创建Dataframe的方法
-
基础语法:
pandas.Dataframe(date,index,columns,dtype,copy)
date: 一组数据(ndarray,series,dict,lists,Dataframe等)
index: 索引值,或者称为行标签,默认为
RangeIndex (0, 1, 2, …, n)
columns: 列标签,或者可认为是列名,默认为
RangeIndex (0, 1, 2, …, n)
dtype: 数据类型
copy: 拷贝数据,默认为False
date应为二维的数据结构。当date为一维数据时,根据轴的理解,最外层的轴为axis=0,即列轴,所以生成的Dataframe为一列数据,而不是一行。或者说这是一个列表,顾名思义,是一列的形式
。
1、字典类
-
字典本身的keys,values即形成二维数据结构,因此values值只能是一维的(字典除外),否则报错。
-
keys值作为列标签columns,keys对应的values值作为一列
-
指定列标签时,由于字典本身的特性,可只取指定的keys;可指定列的顺序;可取字典keys值以外的值作为列标签,此时对应的数据内容values用NAN填充
1.1 数组、列表、元组组成的字典
1.2 Series组成的字典
-
若每个values值元素个数不一致,可用NAN补齐。而对于数组、列表、元组则不能如此操作
1.3 字典组成的字典
-
外层字典keys值作为列标签;内层字典keys值作为行标签;行标签、列标签均可指定范围和顺序,也可取原有keys以外的值
2、列表类
-
需注意轴axis的理解,最外层为axis=0,即列;里面一层为axis=1,即行
2.1 2维列表
2.2 字典组成的列表
2.3 Series组成的列表
第一次写CDNS哦,请各路大佬多多指教!!!走过路过的小伙伴觉得用有快来互动!!!练习代码也会分享。