栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Selenium 解析页面(python + java)

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Selenium 解析页面(python + java)

find_element_by_class_name 根据class获取element节点find_element_by_xpath 根据xml 路径获取element节点find_element_by_tag_name 根据标签获取element节点find_element_by_id 根据id获取element节点 获取节点下的列表 find_elements_by_class_name 根据class获取element节点find_elements_by_xpath 根据xml 路径获取element节点find_elements_by_tag_name 根据标签获取element节点find_elements_by_id 根据id获取element节点 获取节点的属性、值信息

element.get_attribute(“data-sku”) 获取标签属性 data-sku 的值
element.text 获取标签的内容

Java 引入pom依赖
 dependency 
 groupId org.seleniumhq.selenium /groupId 
 artifactId selenium-java /artifactId 
 version 3.141.59 /version 
 /dependency 
demo
package com.zimin.wiki.selenium;
import org.openqa.selenium.By;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;
import java.util.List;
 * author zimin
 * since 2021/9/24 5:23 下午
public class SeleniumTest {
 public static void main(String[] args) {
 ChromeDriver chromeDriver new ChromeDriver();
 //打开网站
 chromeDriver.get( {解析的URL} );
 System.out.println( ---- 获取商品价格 ---- );
 WebElement elementByClassName chromeDriver.findElementByClassName( J-p-4505438 );
 System.out.println(elementByClassName.getText());
 System.out.println( ---- 获取商品图片 ---- );
 List WebElement elementsByXPath chromeDriver.findElementsByXPath( //ul[ class lh ]/li );
 for (WebElement webElement : elementsByXPath) {
 System.out.println(webElement.findElement(By.tagName( img )).getAttribute( src ).replace( n5 , n1 ));
 System.out.println( ---- 获取商品重量 ---- );
 List WebElement weight chromeDriver.findElementsByXPath( //ul[ id summary-weight ]/div[2] );
 System.out.println(weight);
 System.out.println( ---- 获取商品分类 ---- );
 List WebElement categories chromeDriver.findElementsByXPath( //ul[ id choose-attr-1 ]/div[2]/div );
 for (WebElement category : categories) {
 String sku category.getAttribute( data-sku );
 String value category.getAttribute( data-value );
 System.out.println( sku编号: sku ,类别: value);
 System.out.println( ---- 获取商品净含量 ---- );
 List WebElement netWeights chromeDriver.findElementsByXPath( //div[ id choose-attr-2 ]/div[2]/div );
 for (WebElement netWeight : netWeights) {
 String sku netWeight.getAttribute( data-sku );
 String value netWeight.getAttribute( data-value );
 System.out.println( sku编号: sku ,净含量: value);
常用API 获取单个节点 findElementByClassName 根据class获取element节点findElementByXpath 根据xml 路径获取element节点findElementByTagName 根据标签获取element节点findElementById 根据id获取element节点 获取节点下的列表 findElementsByClassName 根据class获取element节点findElementsByXpath 根据xml 路径获取element节点finElementsByTagName 根据标签获取element节点finElementsById 根据id获取element节点 获取节点的属性、值信

element.getAttribute(“data-sku”) 获取标签属性 data-sku 的值
element.getText 获取标签的内容

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/266819.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号