- 前言
- 1. 原理
- 2. 代码
出现403的返回结果
主要是有些服务器为了防止访问量过大,承受服务器的压力,或者是拒绝你的访问。服务器接收到这个信息,理应返回了这个403的信息
在前一块的代码中解决了
Python:爬取数据出现response.status_code为418解决方法
如果还出现了403的访问错误
可以通过如下解决
服务器拒绝访问,可以通过给服务器登录,获取当前的cookie来得到网址的信任。得以爬取该网址的信息
在head头中加入cookie的信息
具体怎么查找该cookie的信息,可以通过登录你要搜寻的网址,点击F12进行查看cookie信息即可
具体代码设置
head = { # 模拟浏览器头部信息,向服务器发送消息
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:92.0) Gecko/20100101 Firefox/92.0',
'cookie':'个人的登录信息'
}
即可成功爬取信息



