df = pd.Dataframe(python_dic)# python字典的键将会变成列标签,值则变为每一行的内容。
pandas中Dataframe类似于一个二维数组,而每一列可以看成一个一维数组,该一维数组在pandas中被称作Series。即Dataframe为一个二维数组,由一列一列的一维数组Series组成。
从csv文件读取df= pd.read_csv('path_to_csv_file')# 读取csv文件
读取其他类型的文件(csv,excel,json)也相同,将命令替换成read_***即可,比如读取excel文件使用read_excel()。
从excel文件读取xls = pd.ExcelFile(path) data = pd.read_excel(xls, 'sheet3') #读取文件的sheet3表格
因为一个excel文件中可以有多张表格,所以在读取excel文件时最好按以上方法,不然pandas会一次性读取所有表格,可能会出现意想不到的后果。
[TIPS]
将当前表格导出的方法为
df.to_excel("name.xlsx",sheet_name="sheet_name",index=Flase)
#`name.xlsx` #整个输出文件的文件名
#`sheet_name `#文件中具体一张表格sheet的名称
#`index=Flase`#是否保存行标签0,1,2....
基础查看
- df.head()
- df.tail()
使用head() 、 tail()可以显示大文档的前5行和末尾5行,加上参数可以声明到底要查看几行,如head(6)显示开头前六行。 - 省略项太多,想要强制不省略显示,使用下述命令,这样pandas会完整打印整个表格。
pd.set_option('display.max_columns', None )
pd.set_option('display.max_rows' , None )
显示信息的概况
- df.dtypes # 显示每一列的数据类型
- df.shape# 显示数组维数



