熊猫已经具有将为您读取整个Excel电子表格的功能,因此您无需手动分析/合并每张工作表。看看pandas.read_excel()。它不仅使您可以单行读取Excel文件,还提供了一些选项来帮助解决您遇到的问题。
由于您有子列,因此您正在寻找的是MultiIndexing。默认情况下,大熊猫将在第一行中作为唯一的标题行读取。您可以向其中传递一个
header参数
pandas.read_excel(),该参数指示要用作标题的行数。在您的特定情况下,您需要
header=[0,1]指示前两行。您可能还会有多张纸,因此您也可以通过
sheetname=None(这告诉它要遍历所有纸)。该命令将是:
df_dict = pandas.read_excel('ExcelFile.xlsx', header=[0, 1], sheetname=None)这将返回一个字典,其中的键是工作表名称,值是每个工作表的Dataframes。如果要将其全部折叠到一个Dataframe中,则可以简单地使用pandas.concat:
df = pandas.concat(df_dict.values(), axis=0)



