栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

selenium爬取图像

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

selenium爬取图像

目标内容(红框中的图片)

代码
from tqdm import tqdm
from selenium import webdriver
from six.moves import urllib
wd webdriver.Chrome()
names [ spellList ]
targetUrls [ https://lol.qq.com/data/info-spell.shtml#Navi , ]
for index, name in enumerate(names):
 wd.get(targetUrls[index]) # 访问指定网页
 block wd.find_element_by_id(name)
 liList block.find_elements_by_tag_name( li )
 for li in tqdm(liList):
 img li.find_element_by_tag_name( img )
 url img.get_attribute( src )
 urllib.request.urlretrieve(url, f ./imgs/{url.split( / )[-1]} )
wd.quit() #关闭浏览器
根据父节点找其儿子节点
# 在li标签中找a标签,再在a标签中找img标签
img li.find_element_by_tag_name( a ).find_element_by_tag_name( img )
获取标签的指定内容
get_attribute( href ) # 获取a标签/img标签的href属性
get_attribute( innerHTML ) # 获取img标签的内部text内容 
print(img.get_attribute( innerHTML ))
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/267563.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号