栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

匹配任何语言的字母

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

匹配任何语言的字母

对于Python中的Unipre正则表达式,我强烈建议以下内容:

  1. 使用 Matthew Barnett的
    regex
    库而不是standard
    re
    ,它实际上并不适合Unipre正则表达式。
  2. 只使用Python 3,不要使用Python2。您希望所有字符串都是Unipre字符串。
  3. 仅使用具有逻辑/抽象Unipre代码点的字符串文字,而不使用编码的字节字符串。
  4. 在流上设置编码,而不必理会。如果您发现自己曾经手动打电话
    .enpre
    等等,那几乎可以肯定是做错了什么。
  5. 仅在代码点和代码单元相同的情况下使用宽泛的构建,永远不要在狭窄的基础上进行构建—考虑使用Unipre健壮性,不妨考虑这样做。
  6. 将所有传入的字符串归一化为NFD,然后归一化为NFC。否则,您将无法获得可靠的行为。

完成此操作后,您可以安全地编写包含

w
or
p{script=Latin}

p{alpha}
and
p{lower}
等的模式,并且知道它们都将按照Unipre标准的规定进行操作。我将在此答案中更详细地解释Python
Unipre regex业务的所有业务。简短的故事是永远
regex
不要使用
re


对于一般的Unipre建议,我在上一届OSCON上也有几篇关于Unipre正则表达式的演讲,除了第3篇演讲以外,大部分都与Python无关,但其中许多内容都是可以适应的。

最后,总会有这样的答案将对上帝(或至少对Unipre的恐惧)的想法带入您的内心。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/611741.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号