使用lxml是最适合python的xml / html库。
import lxml.htmlt = lxml.html.fromstring("...")t.text_content()如果您只想清理html,请查看lxml.html.clean模块

使用lxml是最适合python的xml / html库。
import lxml.htmlt = lxml.html.fromstring("...")t.text_content()如果您只想清理html,请查看lxml.html.clean模块