尝试这个:
import remystr = 'This is a string, with words!'wordList = re.sub("[^w]", " ", mystr).split()这个怎么运作:
从文档:
re.sub(pattern, repl, string, count=0, flags=0)
返回通过用替换repl替换字符串中最左边的非重叠出现的模式而获得的字符串。如果找不到该模式,则返回的字符串不变。repl可以是字符串或函数。
所以在我们的情况下:
模式是任何非字母数字字符。
[ w]表示任何字母数字字符,并且等于字符集[a-zA-Z0-9_]
a到z,A到Z,0到9并加下划线。
因此,我们匹配任何非字母数字字符并将其替换为空格。
然后我们将split()拆分为空格,然后将其转换为列表
所以“你好世界”
成为“你好世界”
带re.sub
然后[‘hello’,’world’]
在split()之后
让我知道是否有任何疑问。



