栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

python -docx从word docx提取表

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python -docx从word docx提取表

您的代码对我来说很好。如何将其插入数据框?

import pandas as pdfrom docx.api import documentdocument = document('test_word.docx')table = document.tables[0]data = []keys = Nonefor i, row in enumerate(table.rows):    text = (cell.text for cell in row.cells)    if i == 0:        keys = tuple(text)        continue    row_data = dict(zip(keys, text))    data.append(row_data)    print (data)df = pd.Dataframe(data)

如何在该表格中显示特定的行和列?我们可以使用iloc根据索引提取行和列

# iloc[row,columns] df.iloc[0,:].tolist() # [5,6,7,8]  - row index 0df.iloc[:,0].tolist() # [5,9,13,17]  - column index 0df.iloc[0,0] # 5  - cell(0,0)df.iloc[1:,2].tolist() # [11,15,19]  - column index 2, but skip first row

等等…

但是,如果您的列有名称(在本例中为数字),则可以这样操作:

#df["name"].tolist() df[1].tolist() # [5,6,7,8] - column with name 1

print(df)

打印,这就是示例文档中表格的外观。

    1   2   3   40   5   6   7   81   9   10  11  122   13  14  15  163   17  18  19  20


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/669238.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号