import numpy as np import pandas as pd2.用Pandas创建数据表
d1 = pd.Dataframe(data = np.random.rand(3,4),index = ['a','b','c'],columns=['q','w','e','r'])) d2 = pd.Dataframe(data = np.random.rand(3,4),index = ['a','b','c'],columns=['q','w','e','r']))index:表示行标签。若不设置该参数,则默认会自动创建一个从 0~N 的整数索引。
columns:列标签。
二.查看数据表 1、切片通过不连续的名称切片
d1[['a','c']]
通过不连续的位置切片
d1[[0,2,4]]2.Pandas库提供的索引操作 loc:基于标签索引(索引名称),用于按标签选取数据。当执行切片操作时,既包含起始索引,也包含结束索引。
查看一行
d1.loc[['a']]
查看一列
d1.loc[:,['q']]
iloc:基于位置索引(整数索引),用于按位置选取数据。当执行切片操作时,只包含起始索引,不包含结束索引。
查看一行
d1.iloc[[0]]
查看一列
d1.iloc[:,[0]]三.数据处理 1.数据增加和删除
增加一列
d1['t']=['1','2','3']
删除一列
del d1['t']
或
d1.drop(['t'],axis = 1)#drop函数默认删除行,列需要加axis = 12.数据表合并 merge
inner取交集
d3=pd.merge(d1,d2,how = 'inner')
outer取并集
d3 = pd.merge(d1,d2,how='outer')



