您的代码对我来说很好。如何将其插入数据框?
import pandas as pdfrom docx.api import documentdocument = document('test_word.docx')table = document.tables[0]data = []keys = Nonefor i, row in enumerate(table.rows): text = (cell.text for cell in row.cells) if i == 0: keys = tuple(text) continue row_data = dict(zip(keys, text)) data.append(row_data) print (data)df = pd.Dataframe(data)如何在该表格中显示特定的行和列?我们可以使用iloc根据索引提取行和列
# iloc[row,columns] df.iloc[0,:].tolist() # [5,6,7,8] - row index 0df.iloc[:,0].tolist() # [5,9,13,17] - column index 0df.iloc[0,0] # 5 - cell(0,0)df.iloc[1:,2].tolist() # [11,15,19] - column index 2, but skip first row
等等…
但是,如果您的列有名称(在本例中为数字),则可以这样操作:
#df["name"].tolist() df[1].tolist() # [5,6,7,8] - column with name 1
print(df)
打印,这就是示例文档中表格的外观。
1 2 3 40 5 6 7 81 9 10 11 122 13 14 15 163 17 18 19 20



