每次使用
find()或时
find_all(),您都从文档的顶层开始,因此,例如,当您请求所有“ td”标签时,您将获得 文档中的 所有“
td”标签 , 而不仅仅是这些在您要搜索的表格和行中。您最好也不要搜索这些内容,因为没有在编写代码时使用它们。
我认为您想做这样的事情:
table1 = soup.find("table", border=1)table2 = table1.find('tbody')table3 = table2.find_all('tr')或者,您知道,更像这样的东西,具有更多描述性的变量名可以启动:
rows = soup.find("table", border=1).find("tbody").find_all("tr")for row in rows: cells = row.find_all("td") rn = cells[0].get_text() # and so on


