使用正则表达式处理文本的一个不错的功能是模式是高级的和声明性的。这为实现留出了很大的优化空间,例如可以排除最长的公共前缀或对静态字符串使用Boyer-
Moore。简洁的注释使专家可以更快地阅读。我立刻明白
if (s/^(.)//) { ...}正在做,并且
index($_, 0, 1) = ""比较吵。
正则表达式的重要考虑因素是 上限 ,而不是下限。它是一个功能强大的工具,因此人们认为它能够从XML,电子邮件地址或C
++程序中正确提取令牌,并且没有意识到需要更强大的工具(例如解析器)。



