1.Pandas中有两个主要的数据结构:Series和Dataframe。
Series数据结构是一种类似于一堆数组的数据对象,由一组数据和行索引构成,Dataframe有行索引和列索引,而Series只有行索引,说明Dataframe是由Series构成的。
2.创建Series和Dataframe
import numpy as np import pandas as pd pd.Series(data=np.array[1,2,3],index=['a','b','c']) data:表示传入的数据 index:表示索引,唯一与数据长度相等,默认会自动创建一个从0-N的整数索引 pd.Dataframe(data=np.random.randint(2,100,12).reshape(3,4),index=['a','b','c'],columns=['q','w','e','r']) index:表示行标签,若不设置参数,则默认会自动创建一个从0-N的整数索引。 columns:列标签。
3.Dataframe 切片和索引
获取行数据有两种方式,需要借助loc属性或iloc属性。loc属性基于行索引名获取数据,用法为 data.loc['行索引'] ,如 data.loc['a'] 可以a行的数据。iloc属性基于数值索引获取数据,用法为 data.iloc[数值] ,如data.iloc[0]。
(1)添加一列t[1,2,3]
(2)用iloc和loc取行
(3)取列
获取Dataframe中的一列数据有两种方式,第一种是用 data['列索引'] ,第二种是用loc,iloc



