栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

如何用python爬虫中的xpath抓取信息?

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何用python爬虫中的xpath抓取信息?

在学习了python爬虫模块后,小编对于获取数据的方法仿佛打开了新的思路。方法之间没有哪种可以不局限于所有的使用环境,小编在每次写的时候都会注明使用,小伙伴们看的时候需要留意,不然运行后弄出乌龙就尴尬了。下面我们一起来看看xpath是如何在python爬虫中抓取信息的吧。


我们使用xpath语法来提取我们所需的信息。 不熟悉xpath语法的自行学习一下,很快就能上手,难度不高。 首先我们在chrome浏览器里进入豆瓣电影TOP250页面并按F12打开开发者工具。

 


我们可以看到每一部电影的信息都在一个

  • ...
  • 里,打开后可以找到我们想要的全部信息,其中spider中初始的request是通过调用 start_requests() 来获取的。 start_requests() 读取 start_urls 中的URL, 并以 parse 为回调函数生成 Request。看一下代码:

     

     

    以上就是xpath语言在python爬虫中抓取信息的方法了,没想到小小的语法还有这么多的作用吧。更多Python学习推荐:PyThon学习网教学中心。


  • 转载请注明:文章转载自 www.mshxw.com
    本文地址:https://www.mshxw.com/it/11857.html
    我们一直用心在做
    关于我们 文章归档 网站地图 联系我们

    版权所有 (c)2021-2022 MSHXW.COM

    ICP备案号:晋ICP备2021003244-6号