BeautifulSoup本身不是DOM库(它不实现DOM
API)。使事情变得更复杂的是,您在该xml片段中使用了名称空间。要解析该特定的XML片段,可以使用BeautifulSoup,如下所示:
from BeautifulSoup import BeautifulSoupxml = """<xml> <web:Web> <web:Total>4000</web:Total> <web:Offset>0</web:Offset> </web:Web></xml>"""doc = BeautifulSoup( xml )print doc.find( 'web:total' ).stringprint doc.find( 'web:offset' ).string
如果您不使用名称空间,则代码可能如下所示:
from BeautifulSoup import BeautifulSoupxml = """<xml> <Web> <Total>4000</Total> <Offset>0</Offset> </Web></xml>"""doc = BeautifulSoup( xml )print doc.xml.web.total.stringprint doc.xml.web.offset.string
这里的关键是BeautifulSoup对命名空间一无所知。因此
web:Web被视为
web:web标签而不是
Web属于
web名称空间的标签。当BeautifulSoup添加
web:web到xml元素字典中时,python语法不能识别
web:web为单个标识符。
您可以通过阅读文档了解更多信息。



