我正在使用lxml的炉.阅读巨大的xml文档。 对于某个主要要素,我检查儿童的内容,处理每个儿童。 但是,我注意到,在检查一个要素内的儿童时,教区实际上有时还缺少一些儿童节点。 我甚至印刷了每个要素的长度,每个要素的长度应为一定数量,但有时比应该少。 令人惊讶的是,这种情况通常发生在第5区(一个区块;主要要素发生)。 为什么教区会误导孩子们? 任何杂质?
Sample code-
from lxml import etree
def parseXml(context,attribList,elemList,mainElement):
for event, element in context:
if element.tag == mainElement and event== start :
for child in element:
if child.tag in elemList:
print len(child) #for a given child,the len should be constant
#do things
elif event== end :
element.clear()
感谢!