这个经过测试的代码段应该做到这一点:
import reline = re.sub(r"</?[d+>", "", line)
编辑:这是一个注释的版本,说明其工作方式:
line = re.sub(r""" (?x) # Use free-spacing mode. < # Match a literal '<' /? # Optionally match a '/' [ # Match a literal '[' d+ # Match one or more digits > # Match a literal '>' """, "", line)
正则表达式很有趣!但我强烈建议你花一两个小时来学习基础知识。对于初学者,你需要了解哪些特殊字符:需要转义的“元字符”(即,前面加反斜杠-字符类的内外规则是不同的。)在以下位置有一个出色的在线教程:www .regular-expressions.info。你在那里度过的时间将使自己获得很多倍的回报。



