主要是记录一下平时学习中遇到的问题的解决办法以及困恼自己的问题
1.读取数据并且显示excel文件的行数和列数
读取数据有两种方法:
1)xlrd模块
import xlrd#导入xlrd模块
df = xlrd.open_workbook('x.xlsx')打开excel文件
sheet1 = df.sheet_by_index(0)
# 根据索引获取第一个工作表的内容(通过更改索引数字0,可以获取第几个工作表的内容) nrows = sheet1.nrows# 获取sheet工作表的行数
ncols = sheet1.ncols# 获取sheet工作表的列数
print(nrows)
print(ncols)
输出结果如图
2)pandas模块
import pandas as pd
df = pd.read_excel('x.xlsx')
print(df.shape)#输出这个文件有几行几列
2.查看数据格式
Pandas模块下:
df.dtypes
3.显示列名
print(df.columns)
结果如图:
4.显示数据前五行后五行:
df.head(5)
df.tail(5)
5.对数据进行排序
为什么浮点数排序结果不对?
6.pandas replace函数结果也不对,是我数据集的问题吗



