这里以四级单词为例,pdf转换为表格后,多达113个sheet。
话不多说,直接上代码,没有相应的库。
注意:运行程序前不能打开该工作表
pip install 相应库名
import xlrd
import pandas as pd
from pandas import DataFrame
from openpyxl import load_workbook
excel_name = r"D:四级词汇.xlsx"
wb = xlrd.open_workbook(excel_name)
sheets = wb.sheet_names()
alldata = DataFrame()
for i in range(len(sheets)):
df = pd.read_excel(excel_name, sheet_name=i, index=False, encoding='utf8')
alldata = alldata.append(df)
writer = pd.ExcelWriter(r"D:四级词汇.xlsx", engine='openpyxl')
book = load_workbook(writer.path)
writer.book = book
# 必须要有上面这两行,假如没有这两行,则会删去其余的sheet表,只保留最终合并的sheet表,合并的sheet表在最后一个,名为“ALLDATA ”
alldata.to_excel(excel_writer=writer, sheet_name="ALLDATA")
writer.save()
writer.close()
print("完成,请到文件夹查看")
如果出现错误如:
PermissionError: [Errno 13] Permission denied: ‘D:APPivx四级词汇.xlsx’
表示该工作表已经打开,不能读写,关闭重新运行程序即可。
完成效果:



