您可以像这样在双换行符上分割:
paragraphs = re.split(r"nn", DATA)
编辑: 要将段落捕获为匹配项,以便获取其起点和终点,请执行以下操作:
for match in re.finditer(r'(?s)((?:[^n][n]?)+)', DATA): print match.start(), match.end()# Prints:# 0 214# 215 298# 299 589

您可以像这样在双换行符上分割:
paragraphs = re.split(r"nn", DATA)
编辑: 要将段落捕获为匹配项,以便获取其起点和终点,请执行以下操作:
for match in re.finditer(r'(?s)((?:[^n][n]?)+)', DATA): print match.start(), match.end()# Prints:# 0 214# 215 298# 299 589