栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

使用python解压缩.gz文件的一部分

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

使用python解压缩.gz文件的一部分

我似乎您需要查看 Python zlib

GZIP格式依赖zlib,但是引入了文件级压缩概念以及CRC检查,这似乎是您目前不想要/不需要的。

例如,请参阅 Dough
Hellman的
这些
代码片段

编辑 :Doubh
Hellman网站上的代码仅显示如何使用zlib进行压缩或解压缩。如上所述,GZIP是“带信封的zlib”,您需要先对信封进行解码,然后才能获取zlib压缩的数据
本身 。这里是更多信息,实际上并不那么复杂:

  • 有关GZIP格式的详细信息,请参阅 RFC 1952
  • 此格式以10字节的标头开头,后跟可选的非压缩元素(例如文件名或注释),然后是zlib压缩数据,其本身后面是CRC-32(精确地是“ Adler32” CRC)。
  • 通过使用 Python的struct模块 ,解析标头应该相对简单
  • 然后可以使用python的zlib模块解压缩zlib序列(或其前几千个字节,因为这就是您要执行的操作),如上面的示例所示
  • 可能出现的问题:如果GZip档案中有多个文件,并且第二个文件在几千个字节的块内开始,我们希望将其解压缩。

很抱歉,既没有提供简单的过程,也没有提供现成的代码段,但是使用上述指示解码文件应该相对较快和简单。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/652016.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号