栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > Web开发 > JavaScript

《前端实战总结》之使用解释器模式实现获取元素Xpath路径的算法

JavaScript 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

《前端实战总结》之使用解释器模式实现获取元素Xpath路径的算法

前端领域里基于javascript的设计模式和算法有很多,在很多复杂应用中也扮演着很重要的角色,接下来就介绍一下javascript设计模式中的解释器模式,并用它来实现一个获取元素Xpath路径的算法。

正文 1.解释器模式

对于一种语言,我们给出其文法表示形式(一种语言中的语法描述工具,用来定义语言的规则),并定义一种解释器,通过这种解释器来解释语言中定义的句子。

定义听起来可能比较抽象,举个例子比如我们常见的网站多语言,要实现多语言我们首先要预定语言的类型,提前设计不同语言的语料库,然后我们会根据配置和统一的变量规则来映射到不同语言。

2.元素的Xpath路径

XPath 用于在 XML 文档中通过元素和属性进行导航。虽然XPath 是用来查找XML节点,但同样可以用来查找HTML文档中的节点,因为HTML和XML结构类似。这里我们只考虑html,即元素在html页面中所处的路径。

那么如何快速获取元素的Xpath路径呢?其实也很简单,我们打开谷歌调试工具:


选中某个元素,如下,单机鼠标右键:


选中Copy XPath即可复制元素的Xpath路径。格式可能长这样:

//*[@id="juejin"]/div[2]/main/div/div[1]/article/div[1]

获取元素Xpath路径的应用场景很多,比如我们经常使用的python爬虫,利用爬虫框架可以通过Xpath路径很方便额控制页面中的某个dom节点,进而获取想要的数据和元素;又比如我们通过发送元素的Xpath路径给后端,后端可以统计某一功能的使用情况和交互数据;又比如分析用户在网站中浏览的热力分布图,路径画像等等。

3.js实现获取元素的Xpath路径

在实现之前,首先我们分析一下Xpath路径的结构,比如我们有一个页面,元素span的结构如下:




    
    
    
    document


    
>我是徐小夕

那么我们的Xpath路径可能长这样:

HTML/BODY|HEAD/DIV/SPAN

从上面可以看出,我们的最右边一个元素都是目标元素,而最左边第一个元素都是最外层容器。要完成这个过程首先我们要通过元素的parentNode来获取当前元素的父元素,直到找到最顶层位置。但我们还需要注意的一点是,每找到上一层我们还要遍历该元素前面的兄弟元素previousSibling,如果这个兄弟元素名字和它后面的元素名字相同,则在元素名上+1.

第一步我们先实现一个遍历同级兄弟元素的方法getSameLevelName:

// 获取兄弟元素名称
function getSameLevelName(node){
    // 如果存在兄弟元素
    if(node.previousSibling) {
 let name = '',   // 返回的兄弟元素名称字符串
    count = 1,    // 紧邻兄弟元素中相同名称元素个数
    nodeName = node.nodeName,
    sibling = node.previousSibling;
 while(sibling){
     if(sibling.nodeType == 1 && sibling.nodeType === node.nodeType && sibling.nodeName){
  if(nodeName == sibling.nodeName){
      name += ++count;
  }else {
      // 重制相同紧邻节点名称节点个数
      count = 1;
      // 追加新的节点名称
      name += '|' + sibling.nodeName.toUpperCase()
  }
     }
     sibling = sibling.previousSibling;
 }
 return name
    }else {
 // 不存在兄弟元素返回''
 return ''
    }
}

第二步,遍历文档树。

// XPath解释器
let Interpreter = (function(){
    return function(node, wrap){
 // 路径数组
 let path = [],
 // 如果不存在容器节点,默认为document
 wrap = wrap || document;
 // 如果当前节点等于容器节点
 if(node === wrap) {
     if(wrap.nodeType == 1) {
  path.push(wrap.nodeName.toUpperCase())
     }
     return path
 }
 // 如果当前节点的父节点不等于容器节点
 if(node.parentNode !== wrap){
     // 对当前节点的父节点执行遍历操作
     path = arguments.callee(node.parentNode, wrap)
 }
 // 如果当前节点的父元素节点与容器节点相同
 else {
     wrap.nodeType == 1 && path.push(wrap.nodeName.toUpperCase())
 }
 // 获取元素的兄弟元素的名称统计
 let siblingsNames = getSameLevelName(node)
 if(node.nodeType == 1){
     path.push(node.nodeName.toUpperCase() + sublingsNames)
 }
 // 返回最终的路径数组结果
 return path
    }
})()

有了这两个方法,我们就可以轻松获取元素的XPath路径啦,比如:

let path = Interpreter(document.querySelector('span'))
console.log(path.join('/'))

这样会返回开篇的一样的数据结构了.如:HTML/BODY|HEAD/DIV/SPAN

最后

如果想了解更多webpack,node,gulp,css3,javascript,nodeJS,canvas等前端知识和实战,欢迎在《趣谈前端》一起学习讨论,共同探索前端的边界。

更多推荐
  • 《前端实战总结》之设计模式的应用——备忘录模式
  • 《前端实战总结》之使用postMessage实现可插拔的跨域聊天机器人
  • 《前端算法系列》如何让前端代码速度提高60倍
  • 让你瞬间提高工作效率的常用js函数汇总(持续更新)
  • 如何用不到200行代码写一款属于自己的js类库
  • 记一次老项目中的跨页面通信问题和前端实现文件下载功能
  • 《前端实战》之变量提升,函数声明提升及变量作用域详解
  • 《前端实战总结》如何在不刷新页面的情况下改变URL
  • css3实战汇总(附源码)
  • 5分钟教你用nodeJS手写一个mock数据服务器
  • 前端组件/库打包利器rollup使用与配置实战
  • web性能优化的15条实用技巧
  • 快速掌握es6+新特性及es6核心语法盘点
转载请注明:文章转载自 www.mshxw.com
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号