栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python爬虫如何用session保持登录?

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python爬虫如何用session保持登录?

在采集数据的前期,我们需要为爬虫准备一个登录的代码,而且要一直保持登录,才不会被网站识别出来。这两天我们也介绍了不少的方法,但是本次我们需要达到一直保持登录的这个条件,小伙伴们有没有其他的方法能够满足条件呢?小编在学习的时候接触到了session,发现它可以让账户处于一直登陆的状态下,接下来我们一起学习session的用法吧。


有很多python的方法可以实现登陆网页,但是如果需要保持登陆条件下使用网页的某些功能,则一般需要利用cookie。在所有的实现方法中,Request包是一种相对比较简洁的方法。

import request


找到目标网页的登陆页面,在浏览器中用右键点击用户名和密码区域“查看网页源代码”。在高亮的代码中找name对应的值,通常是"username", "password"。在这个例子中是"email-login" 和"password-login"。

 

接下来的在代码中建立一个session,保持登陆状态

s = Session()
s = session.post("登陆页面的url",
             
                      'email-login': “用户名”,
                      'password': “密码”,
                      #'Token': "某些网站需要token,可以在这里添加"
 
                  }


之后可以继续利用s 这个session来爬取网页内容或者利用api下载文档。

只要确保完成session的建立,我们的账户就会一直处于登陆状态,当然爬虫也可以继续收集数据啦。有很多数据想要采集,但苦恼于账号不能一直保持登录的可以试试session的方法。更多Python学习指路:PyThon学习网教学中心。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/11563.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号