这是一个已经做出的设计决定,并且可能会朝着任何方向走。蒂姆·彼得斯(Tim
Peters)发表了这篇文章来解释:
例如,如果您用模式x *拆分“ abc”,您期望什么?模式在4个地方匹配(长度为0),但是我敢打赌大多数人都会惊讶
[‘’,’a’,’b’,’c’,’‘]
返回而不是(因为它们确实得到了)
[‘abc’]
不过,有些人不同意他。Guido van
Rossum不希望由于向后兼容性问题而更改它。他确实说:
我可以添加一个标记来启用此行为。
编辑 :
Jan Burgy发布了一种解决方法:
>>> s = "Split along words, preserve punctuation!">>> re.sub(r"s+|b", 'f', s).split('f')['', 'Split', 'along', 'words', ',', 'preserve', 'punctuation', '!']哪里
'f'可以用任何未使用的字符替换。



