栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何使用docx中的python-docx识别分页符

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何使用docx中的python-docx识别分页符

硬分页符将作为

<w:br>
元素出现在run元素(
<w:r>
)中,如下所示:

<w:p>  <w:r>    <w:t>some text</w:t>    <w:br w:type="page"/>  </w:r></w:p>

因此,一种方法是将所有这些出现替换为独特的文本字符串,例如“ {{foobar}}”。

的实现将是这样的:

from lxml import etreefrom docx import nsprefixespage_br_elements = document.xpath(    "//w:p/w:r/w:br[@w:type='page']", namespaces={'w': nsprefixes['w']})for br in page_br_elements:    t = etree.Element('w:t', nsmap={'w': nsprefixes['w']})    t.text = '{{foobar}}'    br.addprevious(t)    parent = br.getparent()    parent.remove(br)

我没有时间进行测试,因此您可能会遇到一些缺失的导入或其他内容,但是所需的一切都应该已经在docx模块中。其余的是

lxml
对_Element的方法调用。

让我知道您的情况,如有需要,我可以进行调整。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/407412.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号