栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python-爬虫中的extract()

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python-爬虫中的extract()

使用scrapy框架爬虫时,用到xpath提取网页标签时,时常用到extract(),有时加上[0],或是extract_first(),那么它们的意义分别是什么呢?

这是一个简单的html结构~

  • 123
  • abc
#1 xx.xpath("./ul[@class='list']/li") #xx是html文档 #xpath解析返回一个解析器列表 #2 xx.xpath("./ul[@class='list']/li").extract() #output #['123','abc] #extract使提取内容转换为Unicode字符串,返回数据类型为list #3 xx.xpath("./ul[@class='list']/li").extract()[0] #output #['123'] #返回列表中第一个元素 #4 xx.xpath("./ul[@class='list']/li")[0].extract() #output与3相同 #返回SelectorList里的第一个元素 #5 #xx.xpath("./ul[@class='list']/li".extract_first() #output与3相同 #和3作用效果相同 #6 xx.xpath("./ul[@class='list']/li")[0].extract()[0] #output #'1' #返回SelectorList里的第一个元素的第一个字符

这下应该明白了吧。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/870615.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号