无论如何,整个XML都是由核心实现解析的。etree.iterparse只是生成器样式的视图,它提供了按标记名称的简单过滤(请参阅docstring
http://lxml.de/api/lxml.etree.iterparse-
class.html)。如果您想进行复杂的过滤,则应自己完成。
解决方案:还注册启动事件:
iterparse(self, source, events=("start", "end",), tag="item")并知道您何时处于“ item”端,何时处于“ item / url / item”端。



