在这里,您有一个很好的解释:
http://www.regular-expressions.info/unipre.html
一些提示:
“不幸的是,Java和.NET尚不支持
X。
P{M}p{M}*用作替代。要匹配任意数量的字素,请使用(?:P{M}p{M}*)+而不是X+。”
“在Java中,
uFFFF即使打开了规范等效功能,正则表达式令牌也仅与指定的代码点匹配。但是,相同的语法
uFFFF也用于将Unipre字符插入Java源代码的文字字符串中。
Pattern.compile("u00E0")这两个代码都将匹配的-点和双代码点编码
à,而
Pattern.compile("\u00E0")仅匹配单代码点版本。请记住,将正则表达式编写为Java字符串文字时,必须转义反斜杠。前者Java代码编译regexà,后者编译
u00E0。根据您所执行的操作,差异可能会很大。”



