正则表达式简介:
正则表达式(Regular expression)是用于描述一组字符串特征的模式,用来匹配特定的字符串。通过特殊字符+普通字符来进行模式描述,从而达到文本匹配目的工具。
正则表达式目前被集成到了各种文本编辑器/文本处理工具当中。
在生活工作中,它被应用于诸多场景,譬如表单提交时,进行用户名密码的验证;从大量信息中快速提取指定内容,在一批url中,查找指定url;将指定格式的文本进行正则匹配查找,找到之后进行特定替换等。
单个符号简介:
1.x 用来表达指定字符x 如:Java匹配Java
2. . 表达任意单个字符(除换行外) 如:Java匹配J..a
3.[] 只有括号内的才参与匹配,只匹配单个字符 如:tan匹配t[abcd]n
4.匹配次数的符号 *(0次或多次)、+(1次或多次)、?(0次或1次)、{n}(恰好n次)、{n,m}(n次到m次之间)
5. ^ 表示否 、如果在方括号内 表示不想匹配的字符 如y匹配[^x]
6.s 表示非空 r表示空
快捷符号简介:
1、d表示[0—9]
2、D表示[^0—9]
3、w表示[0—9A—Z_a—z]
4、W表示[^0—9A—Z_a—z]
5、s表示[tnrf]
6、S表示[^tnrf]
当然,正则表达式也还有许多好用的方法:
如查找类的matches方法(匹配符合一个模式的字符串集)
如“Java is fun”.matches("Java.☆") “Java is cool”.matches("Java.☆")均返回true
还有诸如替换类的repalceAll方法 用于替换所有匹配的子字符串
如:System.out.println("Java Java Java").repalceAll("v\w","wi"));
显示 Jawi Jawi Jawi
又或者repalceFirst方法替换第一个匹配的子字符串
如System.out.println("Java Java Java").repalceFirst("v\w","wi"));
显示 Jawi Java Java
抑或是拆分类的split 使用匹配的分隔符将一个字符串拆分为子字符串
如:String[] tokens = "Java1HTML2Perl".split("\d")
就用数字作为分隔符将字符串分割成Java HTML Perl 并分别存入token[0] token[1] token [2]中



