栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python urllib模块

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python urllib模块

       该模块提供了get请求和post请求,下面是获取百度请求的网页源码,仅供参考

        下面是我导入的urllib模块

from urllib import request
        下面是请求携带的头部,其中最重要的是User-Agent,该头部的功能是模拟浏览器像网站发起请求,其他的可有可无,头部信息可以根据抓包工具或者浏览器的开发者工具查看,具体请自行百度

header={
"Accept": "application/json, text/plain, **",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.80 Safari/537.36 Edg/98.0.1108.43",
"Content-Type": "application/json;charset=UTF-8",
"Origin": "http://xiaobei.dalaola.com",
"Referer": "http://xiaobei.dalaola.com/user",
"Accept-Encoding": "gzip, deflate",
"Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6",
"cookie": "AOAOSTAR_SESSID=c94a1d760ba93dc0e79aad1b9e03dd47"
}

req=request.Request("https://www.baidu.com/",method="get",headers=header)
res=request.urlopen(req)
htmls = res.read()
buff = io.BytesIO(htmls)
f = gzip.GzipFile(fileobj=buff)
htmls = f.read().decode('utf-8')
print(htmls)

控制台运行结果如下:

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/741037.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号