栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Python Selenium获取所有“ href”属性

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python Selenium获取所有“ href”属性

这是从所有页面获取所有书籍的代码:

from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECdriver = webdriver.Chrome()baseUrl = "http://www.allitebooks.com/page/1/?s=python"driver.get(baseUrl)# wait = WebDriverWait(driver, 5)# wait.until(EC.visibility_of_element_located((By.CSS_SELECTOR, ".search-result-list li")))# Get last page numberlastPage = int(driver.find_element(By.CSS_SELECTOR, ".pagination a:last-child").text)# Get all HREFs for the first page and save them in hrefs listjs = 'return [...document.querySelectorAll(".entry-title a")].map(e=>e.href)'hrefs = driver.execute_script(js)# Iterate throw all pages and get all HREFs of booksfor i in range(2, lastPage):    driver.get("http://www.allitebooks.com/page/" + str(i) + "/?s=python")    hrefs.extend(driver.execute_script(js))for href in hrefs:    print(href)


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/623943.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号