栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python爬虫---cookie和代理基础

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python爬虫---cookie和代理基础

  1. cookie:用来让服务器端记录客户端的相关状态
  • 手动处理:通过抓包工具获取cookie值,将该值封装到headers中(不建议使用)
  • 自动处理:
    • cookie值来源是哪里
      • 模拟登陆post,由服务器端创建 
    • session会话对象:
      •   作用:可以进行请求的发送;如果请求过程中产生了cookie,则该cookie会被自动存储/携带在该session对象 
    • 创建一个session对象,session=request.Session()
    • 使用sesssion对象进行模拟登陆post请求的发送(cookie就会被存储在session中)
    • session对象对个人主页对应的get请求进行发送(携带了cookie)

     2.代理:破解封IP这种反爬机制

        代理的作用:

  • 可以突破自身IP访问的限制
  • 可以隐藏自身真实的IP免受攻击

        代理相关的网站:

  • 快代理
  • 西祠代理
  • http://www.goubanjia.com

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/488433.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号