栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

使用beautifulsoup提取换行符之间的文本(例如 标签)

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

使用beautifulsoup提取换行符之间的文本(例如  标签)

如果只需要两个

<br />
标签之间的任何文本,则可以执行以下操作:

from BeautifulSoup import BeautifulSoup, NavigableString, Taginput = '''<br />important Text 1<br /><br />Not important Text<br />important Text 2<br />important Text 3<br /><br />Non important Text<br />important Text 4<br />'''soup = BeautifulSoup(input)for br in soup.findAll('br'):    next_s = br.nextSibling    if not (next_s and isinstance(next_s,NavigableString)):        continue    next2_s = next_s.nextSibling    if next2_s and isinstance(next2_s,Tag) and next2_s.name == 'br':        text = str(next_s).strip()        if text: print "Found:", next_s

但是也许我误解了你的问题?您对问题的描述似乎与示例数据中的“重要” /“不重要”不符,因此我不再赘述;)



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/625281.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号