栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

【无标题】python网络爬虫——自学笔记1.1用requests库爬取图片(补充)

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

【无标题】python网络爬虫——自学笔记1.1用requests库爬取图片(补充)

上一篇介绍了如何用requests库爬取网络上的图片,但是有的网页可能用上一篇的代码无法爬取,会出现错误,这篇文章着重讲一讲为什么爬取失败的原因之一:网页端有反爬功能,可以检测python爬虫的头部信息,从而发现是爬虫在访问网页,而不是真人用户

首先,我们要看看python爬虫的头部信息有哪些,requests库的request方法就有这个功能,代码如下:

url = "https://img-operation.csdnimg.cn/csdn/silkroad/img/1651918083872.png"
r = requests.get(url)
print(r.request.headers)

运行结果:

{'User-Agent': 'python-requests/2.27.1', 'Accept-Encoding': 'gzip, deflate', 'Accept': '**', 'Connection': 'keep-alive'}

可以看到,User-Agent的值被成功修改为了Mozilla/5.0,大功告成咯!

最后,谢谢你的阅读,希望我写的东西对你有所帮助!

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/879618.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号