栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python爬虫----cookie,main,接口问题补充

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python爬虫----cookie,main,接口问题补充

Python爬虫----cookie,main,接口问题补充

文章目录
  • Python爬虫----cookie,main,接口问题补充
  • cookie
  • main
  • 找接口问题(动静态加载)
    • 动态数据加载
    • 如何确定真正有数据的接口?
  • 可以尝试案例


cookie
  • 反反爬
  • 模拟登陆(模拟登陆QQ空间)
main

1、如果是执行当前文件 当前文件的所有代码都会被执行

2、如果是通过import_test去运行test文件 test文件里面的if name == 'main’这里面的代码就不会被执行

3、所以你们把不想要被其他文件引用的代码部分 放在if name == 'main’里面

找接口问题(动静态加载) 动态数据加载

如果你要爬取的数据 在右键查看网页源码中找不到 就就证明你要爬取的数据是动态加载出来的
对于动态加载出来的数据:

  • 找数据接口(network 先去XHR中找 如果找不到 会到ALL里面找)
  • 通过selenium
如何确定真正有数据的接口?

1、去数据包中的 preview或者是response里面找 有没有你想要的数据 有就是

2、在确定数据包中有我们想要的数据之后 我们就能够确定爬取的目标url了

3、如果目标url和代码都没啥问题 但是爬取下来的数据跟在浏览器中看到的不太一样
那就证明很有可能是被反爬了

4、一般通过分析数据接口爬取到的数据 是类似于json格式的

可以尝试案例

网址:案例网址
爬取需求:爬取品名和发布日期

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/864339.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号