栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > PHP > 正则表达

正则表达式学习教程之回溯引用backreference详解

正则表达 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

正则表达式学习教程之回溯引用backreference详解

本文实例讲述了正则表达式回溯引用backreference。分享给大家供大家参考,具体如下:

在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。

一、问题引入

一个在HTML页面中匹配标题标签(H1—H6)的问题:

文本:


Welcome to my page
Content is divided into twosections:
Introduction Information about me. Hobby Information about my hobby. This is invalid HTML

正则表达式:<[hH][1-6]>.*?

结果:


【Welcome to my page】
Content is divided into twosections:

【Introduction】
Information about me.
【Hobby】
Information about my hobby.
【This is invalid HTML】

分析:模式<[hH][1-6]>匹配任何一级标题的开始标签,而且不区分大小写,在这个例子中它匹配到了、,匹配到了、、;这里使用了懒惰型元字符来匹配标签中的文本,否则会匹配到从第一个开始标签到最后一下结束标签之间的内容。但是从结果可以看出,有一个无效的标签也匹配上了,即,它们根本不能配对。要解决这个问题,就需要使用到回溯引用(backreference)。

二、回溯引用匹配

回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用,在前面已经介绍过了。现在来解决前面的例子:

文本:


Welcome to my page
Content is divided into twosections:
Introduction Information about me. Hobby Information about my hobby. This is invalid HTML

正则表达式:<[hH]([1-6])>.*?

结果:


【Welcome to my page】
Content is divided into twosections:

【Introduction】
Information about me.
【Hobby】
Information about my hobby.
This is invalid HTML

分析:首先匹配开始标题标签的模式<[hH]([1-6])>,使用括号把[1-6]做为子表达式,而匹配结束标题标签模式为,其中1表示引用第一个子表达式,即([1-6]),如果([1-6])匹配到的是1,那1也匹配到1,如果匹配到2,那1也匹配到2,所以最后一个无效的标题标签就不会被匹配到了。

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

Javascript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

更多关于Javascript相关内容感兴趣的读者可查看本站专题:《Javascript正则表达式技巧大全》、《Javascript替换操作技巧总结》、《Javascript查找算法技巧总结》、《Javascript数据结构与算法技巧总结》、《Javascript遍历算法与技巧总结》、《Javascript中json操作技巧总结》、《Javascript错误与调试技巧总结》及《Javascript数学运算用法总结》

希望本文所述对大家Javascript程序设计有所帮助。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/60267.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号