是常见的beautifulsoup用法,select(返回的是列表值)可以查询标签,id,class,层级选择器,组选择器,属性选择器。。。
附上一个常见用法的汇总和实战
python使用BeautifulSoup解析豆瓣读书网页并获取相关数值https://blog.csdn.net/weixin_55579895/article/details/120457867?spm=1001.2014.3001.5502
python爬虫使用beautifulsoup解析网址以及常见的beautifulsoup用法https://blog.csdn.net/weixin_55579895/article/details/120440138?spm=1001.2014.3001.5502
# select(返回列表) 标签,id,class,层级选择器,组选择器,属性选择器。。。
# 通过id #
a_element = soup.select('#link11')
# 通过class .
a_element = soup.select('.item-inactive')
# 层级选择器 层级姓名+空格+层级姓名
a_element = soup.select('li a')
# 通过某层(标签)的某个属性 标签名[属性名='属性值']
a_element = soup.select('li[]')
# 标签包裹的内容 get_text()
a_element = soup.select('#link11')[0].get_text()
a_element = soup.select('li a')[0].get_text()
————————————————
版权声明:本文为CSDN博主「十三先生po」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_55579895/article/details/120440138
xpath和json
- XPath (XML Path Language) 是一门在 HTMLXML 文档中查找信息的语言,可用来在 HTMLXML 文档中对元素和属性进行遍历
python使用xpath语言解析遍历HTMLXML 文档中元素,属性以及xpath的基本认识,xpath_helper的简单使用https://blog.csdn.net/weixin_55579895/article/details/120436338?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163281563916780262583460%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=163281563916780262583460&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2blogfirst_rank_v2~rank_v29-1-120436338.pc_v2_rank_blog_default&utm_term=xpath&spm=1018.2226.3001.4450
json、xpath数据的快捷检阅方法,使用jsonpath将拉钩的json数据提取某一个并且保存到本地(保存有两种方法)的实战https://blog.csdn.net/weixin_55579895/article/details/120391215?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163281563916780262583460%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=163281563916780262583460&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2blogfirst_rank_v2~rank_v29-2-120391215.pc_v2_rank_blog_default&utm_term=xpath&spm=1018.2226.3001.4450



