BeautifulSoup解析l缺少闭合标签的html时，html.parser和lxml区别

Python 更新时间：2026-04-08 02:36:00 发布时间：1637天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

BeautifulSoup解析缺少闭合标签的html时，html.parser丢失数据只解析了第一条，lxml补全后没有丢失数据

from bs4 import BeautifulSoup

raw = """
    

    
        
            test
        
    

    
        
            
                
                    
                        孙悟空
                    
                    
                        七十二变
                    

                

                    
                        唐三藏
                    
                    
                        紧箍咒
                    
            
        
    

    
"""

peoples = []
# html = BeautifulSoup(raw, "html.parser")
html = BeautifulSoup(raw, "lxml")
for row in html.select("table > tbody > tr"):
    name, skill = "", ""
    for i, col in enumerate(row.select("td")):
        if i == 0:
            name = col.text.strip()
        elif i == 1:
            skill = col.text.strip()
    peoples.append({"name": name, "skill": skill})
print(peoples)

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/317734.html

上一篇题目描述：判断一个非负整数是否为两个整数的平方和。

下一篇 MySQL数据库的使用及其语句

Python相关栏目本月热门文章

关于我们文章归档网站地图联系我们