栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python爬虫--人人网模拟登录cookie(四)

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python爬虫--人人网模拟登录cookie(四)

为什么在浏览器中就可以对个人主页的url发起get请求拿到数据 而使用request模块中就不可以


因此只需携带cookie就可以

1. 手动cookie处理

通过抓包工具获取cookie值 将该值封装到headers中。 不建议使用

不建议 有的网站cookie值可能是存在有效时常的 过了该时间段 cookie可能无法使用 有的网站也是动态变换的

2. 自动处理

cookie值的来源是哪里
模拟登录post请求后 由服务器端创建

session会话对象⭐

作用

可以进行请求发送如果请求过程中产生了cookie 则该cookie会被自动存储/携带在该session对象中 步骤⭐⭐ 创建一个session对象 session requests.Session()使用session对象进行模拟登录post请求的发送 cookie就会被自动存储在session中 session对象对个人主页对应的get请求进行发送 携带了cookie
# 创建一个session对象
session requests.Session()
# 对验证码图片进行捕获和识别
# 使用超级鹰云平台进行图片识别
# 使用session进行post请求发送
response session.post(url login_url,headers headers, data data)
# 使用携带cookie的session进行get请求的发送
detail_page_text session.get(url detail_url,headers headers).text
with open( bobo.html , w ,encoding utf-8 ) as fp:
 fp.write(detail_page_text)
结果展示
二、代理讲解

在requests模块中如何使用代理IP的操作

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/268349.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号