lxml.html.parse
不获取URL。
使用urllib2的方法如下:
>>> from urllib2 import urlopen>>> from lxml.html import parse>>> page = urlopen('http://www.google.com')>>> p = parse(page)>>> p.getroot()<Element html at 1304050>更新
史蒂文是正确的。
lxml.etree.parse应该接受并加载网址。我错过了。我尝试删除此答案,但不允许这样做。
我撤回了有关不获取URL的声明。



