栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

一分钟包学会Pyhon中的Selenium库爬取动态网页<1>

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

一分钟包学会Pyhon中的Selenium库爬取动态网页<1>

文章目录
  • 一、Selenium是什么?
  • 二、使用步骤
    • 1.去官网下载库
    • 2.查找元素
    • 3.设置延时
    • 4.引入库
  • 总结


一、Selenium是什么?

Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera,Edge等。这个工具的主要功能包括:测试与浏览器的兼容性——测试应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求

二、使用步骤 1.去官网下载库

Chromedriver官网
我下载的是96版本的,将下载好的chromedrive.exe文件放置Python安装的根目录下
如图:

2.查找元素

对于操作浏览器中的页面的自动化测试框架来说,肯定少不了去发现网页中的元素,那么都有哪些方法了,以下就是我们可以通过Python快速获取的一些方法:
find_element(‘id’,‘kw’)
#根据所需指定:如‘id’、‘xpath’等,第二个参数为:对应的属性值——这个方法了常用,以下的其他都是通过这个方法封装的,这个会灵活一点
find_element_by_css_selector
通过CSS选择器查找指定的一个元素(和xpath定位找到类似),优先使用,日后查找问题会方便快捷
find_element_by_xpath
通过Xpath语法来指定的一个元素

3.设置延时

【等待的作用】: 在系统的功能运行过程中,所有的内容需要一定的时间来实现展示(需要从服务端获取到返回回来)
先从导入库

import time   
time.sleep(5)  #休眠5秒
4.引入库

代码如下(示例):

from selenium import webdriver
from selenium.webdriver.common.by import By
import time

接下来就是初始化的操作 这是我们要操作的网页,并且通过ID关键词搜索

driver = webdriver.Chrome()
driver.get('https://cn.bing.com/')
time.sleep(3)
element = driver.find_element(By.ID, 'sb_form_q') #根据元素id进行搜寻
element.send_keys('周杰伦n') #将关键词进行搜索
```c

运行动态图


总结

以上就是今天要讲的内容,本文仅仅简单介绍了selenium的使用,而selenium提供了大量能使我们快速便捷地处理数据的一些功能。希望大家能够支持一波,你的肯定是我最大的支持!

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/887508.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号