(1)Series是一种一维数组形对象,他包含一个值序列(list,array,dict),并且包含索引(index)。index长度=值序列的长度
#创建一个series #pd.Series(data,index,name) #data为list或者array,dict,index为索引,长度=data的长度,name为Series对象名称 series = pd.Series([2,8,3.01,8.99,8.59],index=['a','b','c','d','e'],name='This is a series') #输出结果: a 2.00 b 8.00 c 3.01 d 8.99 e 8.59 Name: This is a series, dtype: float64
Series的属性:
series.values
series.index
series.ndim
series.shape
series.size
series.dtype
注意:
#判断值是否存在于其中:不应使用'3' in x,应使用'3' in x.values
#切片:(类似于列表的方式)如:x[1:3]获取的值为索引为1和2,不包括3。1:3表示索引标签值,和list元素的访问不一样。
#定位获取:(可用于随机抽样)如x[[2,1,0]]结果如下图:
#数据的追加,不能形如x.append('3')的形式追加,需要追加一个序列,形如x=x.append(Series(['3']))
#需要用原来的序列来接受。如果没有设置索引,那么就会默认从0开始自动设置索引
series.append(pd.Series([3]))
Dataframe
Series是一维的数组型对象,他可以看做是Dataframe的一列。
df = pd.Dataframe(data,index,dtype,columns)
#data 是list,array,dict
#index是行索引
#dtype是数据类型
#columns是列标签
df = pd.Dataframe(data,index,dtype,columns) #data 是list,array,dict #index是行索引 #dtype是数据类型 #columns是列标签
常用属性:
df.values df.shape df.dtypes df.ndim df.columns df.columns.tolist()



