简单的答案imo是,如果您相信源代码格式正确,请使用lxml解决方案。否则,BeautifulSoup一直。
编辑:
这个答案现在已经三岁了;值得注意的是,就像乔纳森·瓦纳斯科(Jonathan
Vanasco)在评论中所做的那样,
BeautifulSoup4现在支持将其
lxml用作内部解析器,因此,如果您愿意,您可以使用BeautifulSoup的高级功能和界面,而不会影响大多数性能(尽管我仍然可以直面
lxml自己-
也许只是习惯的力量:))。

简单的答案imo是,如果您相信源代码格式正确,请使用lxml解决方案。否则,BeautifulSoup一直。
编辑:
这个答案现在已经三岁了;值得注意的是,就像乔纳森·瓦纳斯科(Jonathan
Vanasco)在评论中所做的那样,
BeautifulSoup4现在支持将其
lxml用作内部解析器,因此,如果您愿意,您可以使用BeautifulSoup的高级功能和界面,而不会影响大多数性能(尽管我仍然可以直面
lxml自己-