您使用的是python 2.x还是3.0?
如果您使用的是2.x,请尝试使用“ u”使正则表达式字符串成为unipre-escape字符串。由于它是正则表达式,因此最好使用“
r”将正则表达式字符串设置为原始字符串。另外,将整个模式放在括号中也是多余的。
re.sub(ur'[u064B-u0652u06D4u0670u0674u06D5-u06ED]+', '', ...)
http://docs.python.org/tutorial/introduction.html#unipre-
strings
编辑:
将re.UNICODE / re.U /(?u)标志用于unipre正则表达式也是一种好习惯,但它只会影响 w或
b这样的字符类别名,而该模式不使用任何别名,因此不会受到影响。



