栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

使用Python请求模块下载并保存PDF文件

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

使用Python请求模块下载并保存PDF文件

response.content
在这种情况下,您应该使用:

with open('/tmp/metadata.pdf', 'wb') as f:    f.write(response.content)

从文件:

对于非文本请求,您还可以字节形式访问响应主体:

>>> r.contentb'[{"repository":{"open_issues":0,"url":"https://github.com/...

因此,这意味着:

response.text
将输出作为字符串对象返回,在下载 文本文件 时使用它。如HTML文件等

response.content
以字节对象返回输出,在下载 二进制文件 时使用它。如PDF文件,音频文件,图像等。


您还可以使用

response.raw
代替。但是,当您要下载的文件很大时,请使用它。以下是一个基本示例,您也可以在文档中找到该示例:

import requestsurl = 'http://www.hrecos.org//images/Data/forweb/HRTVBSH.metadata.pdf'r = requests.get(url, stream=True)with open('/tmp/metadata.pdf', 'wb') as fd:    for chunk in r.iter_content(chunk_size):        fd.write(chunk)

chunk_size
是您要使用的块大小。如果将其设置为
2000
,则请求将下载该文件的第一个
2000
字节,将其写入文件,然后一次又一次地执行,除非完成。

这样可以节省您的RAM。但是

response.content
在这种情况下,我宁愿使用它,因为您的文件很小。如您所见,使用
response.raw
非常复杂。


关联:

  • 如何使用requests.py在python中下载大文件?

  • 如何使用请求下载图像



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/596352.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号