栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

Java正则表达式如何匹配特定html标签内的内容

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Java正则表达式如何匹配特定html标签内的内容

如题:

使用正则表达式,怎么匹配特定html标签内的内容。

比如,对于如下文本串:

... ignored content
prefix content
inner content
postfix content
... ignored content

我们要提取出标签内的内容: inner content(这里的html标签可以换成任何其它的标签,比如

标签)

这里引入正则表达式的group概念:详细点击文章查看

比如:对于一个正则表达式( ( A ) ( B ( C ) ) )

  • group 1为:( ( A ) ( B ( C ) ) )
  • group 2为:( A )
  • group 3为:( B ( C ) )
  • group 4为:( C )

这样,我们就能够构造出如下的正则表达式:.*(<(html>)(.*)

此表达式的group概念为:

  • group 1: (<(html>)(.*)
  • group 2: (html>)
  • group 3: (.*)

显然我们要求的就是group3的内容。

注意:2是对group2的引用,也就是html>

该正则表达式也可以写成: .*(<(html>)(.*))).* 化简其实就是.*(.*).*

代码实现为:

String p = ".*(<(html>)(.*)午休abcpostfix";

System.out.println("Pattern: " + p);
System.out.println("String to be test: " + m);

Pattern pattern = Pattern.compile(p);
Matcher matcher = pattern.matcher(m);
if(matcher.matches()) {
 System.out.println("Matched String: " + matcher.group(3));
} else {
 System.out.println("So sad, not matching anything!");
}

总结

到此这篇关于Java正则表达式如何匹配特定html标签内容的文章就介绍到这了,更多相关Java正则表达式匹配html标签内容内容请搜索考高分网以前的文章或继续浏览下面的相关文章希望大家以后多多支持考高分网!

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/132127.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号