栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python爬虫常用方法中,beautiful

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python爬虫常用方法中,beautiful

beautiful_soup解析的select方法

是常见的beautifulsoup用法,select(返回的是列表值)可以查询标签,id,class,层级选择器,组选择器,属性选择器。。。
附上一个常见用法的汇总和实战
python使用BeautifulSoup解析豆瓣读书网页并获取相关数值https://blog.csdn.net/weixin_55579895/article/details/120457867?spm=1001.2014.3001.5502


python爬虫使用beautifulsoup解析网址以及常见的beautifulsoup用法https://blog.csdn.net/weixin_55579895/article/details/120440138?spm=1001.2014.3001.5502

# select(返回列表) 标签,id,class,层级选择器,组选择器,属性选择器。。。
# 通过id #
a_element = soup.select('#link11') 
# 通过class .
a_element = soup.select('.item-inactive')
# 层级选择器 层级姓名+空格+层级姓名
a_element = soup.select('li a')
# 通过某层(标签)的某个属性 标签名[属性名='属性值']
a_element = soup.select('li[]')
# 标签包裹的内容 get_text()
a_element = soup.select('#link11')[0].get_text()
a_element = soup.select('li a')[0].get_text()
————————————————
版权声明:本文为CSDN博主「十三先生po」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_55579895/article/details/120440138

xpath和json
  • XPath (XML Path Language) 是一门在 HTMLXML 文档中查找信息的语言,可用来在 HTMLXML 文档中对元素和属性进行遍历

    python使用xpath语言解析遍历HTMLXML 文档中元素,属性以及xpath的基本认识,xpath_helper的简单使用https://blog.csdn.net/weixin_55579895/article/details/120436338?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163281563916780262583460%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=163281563916780262583460&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2blogfirst_rank_v2~rank_v29-1-120436338.pc_v2_rank_blog_default&utm_term=xpath&spm=1018.2226.3001.4450
xpath常用语法

常用的json路径和xpath写法对照


json、xpath数据的快捷检阅方法,使用jsonpath将拉钩的json数据提取某一个并且保存到本地(保存有两种方法)的实战https://blog.csdn.net/weixin_55579895/article/details/120391215?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163281563916780262583460%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=163281563916780262583460&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2blogfirst_rank_v2~rank_v29-2-120391215.pc_v2_rank_blog_default&utm_term=xpath&spm=1018.2226.3001.4450

JSonPath 示例


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/275109.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号