Python解析XMl文件,改变getElementsByTagName()方法索引无效

Python解析XMl文件,改变getElementsByTagName()方法索引无效

问题描述:

想从xml文本中提取标签为‘abstract’的内容,但是文本有多个‘abstract’标签,故打算依次提取,尝试的解决方法是改变getElementsByTagName()方法的索引([0]、[1]等),但无论怎么改,都只打印第一个‘abstract’中的内容。同事电脑却随着索引的改变,打印的内容也发生改变。不知道是哪里出现了问题,以下为xml文件和代码:

img

img

#coding : UTF-8
import xml.dom.minidom

document_tree = xml.dom.minidom.parse('SAX.xml')
style = document_tree.getElementsByTagName("abstract")[1].getElementsByTagName("style")[0].childNodes[0].data
print(style)


getElementsByTagName方法只是获取html标签(DOM)的name。