模式是:
{((?>[^{}]+|(?R))*)}您可以看到此示例适用于您:
regex.findall("{((?>[^{}]+|(?R))*)}", "{1, {2, 3}} {4, 5}")# ['1, {2, 3}', '4, 5']说明:
m部分需要排除括号。如果您希望同时允许一个量词
[^{}]并重复该基团而没有催化回溯问题,则需要使用原子基团。更明确地说,如果缺少最后一个大括号,则此正则表达式引擎将按原子组而不是逐个字符地回溯原子组。为了说明这一点,您可以使量词具有以下所有格:({((?>[^{}]+|(?R))*+)}或{((?:[^{}]+|(?R))*+)}由于原子团不再有用)。该原子团
(?>....)和所有格量词
?+,
*+,
++是相同的特征的两侧。此功能禁止正则表达式引擎在成为“原子”的字符组内回溯
(某些内容您不能分割成较小的部分) 。
基本示例是以下两种始终失败的模式
aaaaaaaaaab:
(?>a+)aba++ab
那是:
regex.match("a++ab", "aaaaaaaaaab")regex.match("(?>a+)ab", "aaaaaaaaaab")当您使用
(?:a+)或
a+regex引擎时(默认情况下)记录(预先记录)所有字符的所有回溯位置。但是,当您使用原子组或所有格量词时,将不再记录这些回溯位置(组开始时除外)。因此,当发生回溯机制时,无法返回最后的“
a”字符。只有整个小组都可以退还。
[编辑]:如果您使用“展开”子模式来描述方括号之间的内容,则可以用更有效的方式编写模式:
{([^{}]*+(?:(?R)[^{}]*)*+)}


