您的XPath显然太长了,为什么不试试较短的XPath看看它们是否匹配。一个问题可能是“ tbody”,浏览器会在DOM中自动创建“
tbody”,但HTML标记通常不包含它。
这是有关如何使用XPath结果的示例:
>>> from lxml import etree>>> from StringIO import StringIO>>> doc = etree.parse(StringIO("<html><body>a<something/>b</body></root>"), etree.HTMLParser())>>> doc.xpath("/html/body/text()")['a', 'b']因此
"".join(...),如果需要,您可以将所有文本部分放在一起。



