栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何从BeautifulSoup中的span标签获取文本

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何从BeautifulSoup中的span标签获取文本

您可以使用css选择器,使用标题文本拉出所需的跨度:

soup = BeautifulSoup("""<div ><div ><span title="000 Plus Minimum RAM Requirement">1 GB</span> </div>""", "xml")print(soup.select_one("span[title*=RAM]").text)

找到具有包含 RAMtitle 属性的 跨度 ,等效于在python中说。

if "RAM" inspan["title"]

或在 re.compile中 使用 find __

import reprint(soup.find("span", title=re.compile("RAM")).text)

要获取所有数据:

from bs4 import BeautifulSoup r  = requests.get("http://www.game-debate.com/games/index.php?g_id=21580&game=000%20Plus").contentsoup = BeautifulSoup(r,"lxml")cont = soup.select_one("div.systemRequirementsRamContent")ram = cont.select_one("span")print(ram["title"], ram.text)for span in soup.select("div.systemRequirementsSmallerBox.sysReqGameSmallBox span"):        print(span["title"],span.text)

这会给你:

000 Plus Minimum RAM Requirement 1 GB000 Plus Minimum Operating System Requirement Win Xp 32000 Plus Minimum Direct X Requirement DX 9000 Plus Minimum Hard Disk Drive Space Requirement 500 MB000 Plus GD Adjusted Operating System Requirement Win Xp 32000 Plus GD Adjusted Direct X Requirement DX 9000 Plus GD Adjusted Hard Disk Drive Space Requirement 500 MB000 Plus Recommended Operating System Requirement Win Xp 32000 Plus Recommended Hard Disk Drive Space Requirement 500 MB


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/617708.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号