栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

由于python不能直接处理doc,所以先把doc转换成docx

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

由于python不能直接处理doc,所以先把doc转换成docx

由于python不能直接处理doc,所以先把doc转换成docx

import os
from glob import glob
from win32com import client


# 转换doc为docx
def doc2docx(fn):
    word = client.Dispatch("Word.Application")  # 打开word应用程序
    # for file in files:
    doc = word.documents.Open(fn)  # 打开word文件
    doc.SaveAs("{}x".format(fn), 12)  # 另存为后缀为".docx"的文件,其中参数12或16指docx文件
    doc.Close()  # 关闭原来word文件
    word.Quit()


# 转换docx为doc
def docx2doc(fn):
    word = client.Dispatch("Word.Application")  # 打开word应用程序
    # for file in files:
    doc = word.documents.Open(fn)  # 打开word文件
    doc.SaveAs("{}".format(fn[:-1]), 0)  # 另存为后缀为".docx"的文件,其中参数0指doc
    doc.Close()  # 关闭原来word文件
    word.Quit()


# path = './b.doc'
# abs_path = os.path.abspath(path)
# print(abs_path)

doc_path = './files/*.doc'

doc_li = glob(doc_path)
total_num = len(doc_li)
processed_num = 0
for one_doc in doc_li:
    abs_doc = os.path.abspath(one_doc)
    # print(abs_doc)
    processed_num += 1
    print('processed {} / {}'.format(processed_num, total_num))
    try:
        doc2docx(abs_doc)
    except Exception as e:
        print(e)

https://pypi.tuna.tsinghua.edu.cn/packages/25/54/177ee28fec4ecd23fa539f3df78067e7a4927515b84eac34e36060fcdb8d/pywin32-300-cp37-cp37m-win_amd64.whl

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/461741.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号