栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何在python的scrapy选择器中仅提取文本

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何在python的scrapy选择器中仅提取文本

//h1[@]

在上面的xpath中,你正在选择

h1
具有
class
属性的标签
state

所以这就是为什么它选择所有进入的东西

h1 element

如果你只想选择

h1
标签文本,则只需

//h1[@]/text()

如果要选择

h1
标签的文本及其子标签,则必须使用

//h1[@]//text()

因此区别在于

/text()
特定标签的文本,特定标签的文本
//text()
及其子标签

下面提到的代码为你工作

site = ''.join(hxs.select("//h1[@]/text()").extract()).strip()


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/371965.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号