Xpath解析HTML也许XML
Xpath解析HTML或者XML
什么是XPath?
分类: java web 开发2006-09-07 09:53 1469人阅读 评论(1) 收藏 举报
XPath是一个获取XML文档中你所需要的节点元素的组件。它允许你用很少的代码就能获取指定的路径下你所选取的节点的值。例如,你有一个类似下面的XML文档:
程序代码
<products>
<product SKU="7123734">
<name>Big Metal Pot</name>
<price>19.95</price>
</product>
<product SKU="752585">
<name>Plate</name>
<price>12.95</price>
</product>
<product SKU="4182476">
<name>Spoon</name>
<price>4.95</price>
</product>
</products>
<products>
<product SKU="7123734">
<name>Big Metal Pot</name>
<price>19.95</price>
</product>
<product SKU="752585">
<name>Plate</name>
<price>12.95</price>
</product>
<product SKU="4182476">
<name>Spoon</name>
<price>4.95</price>
</product>
</products>
你可以用下面的代码来获取产品的种类
myXPathDocument.selectNodes("/products/product");
你也可以用这样的代码来获得所有产品中价格超过5美圆的产品:
myXPathDocument.selectNodes("/products/product[./price > 5]");
你也可以获取所有的 SKUs 就像这样:
myXPathDocument.selectNodes("/products/product/@sku");
---------------------------------------------------------------
XPath 规范基本上遵循与文件系统寻址相同的规则:
- 如果 XPath 表达式以斜杠 (/) 开头,代表的是 XML 元素的绝对路径(从 XML 文档的根开始)。
- 如果 XPath 表达式以双斜杠 (//) 开头,则会选择当前文档中符合指定条件的所有元素,而不考虑它们在 XML 文档中的位置。例如,
//employee
会查找 XML 文档中的所有员工节点。 - 星号 (*) 会选择由前面的路径定位的所有 XML 元素。例如,
/company/department/*
选择一个部门的所有子节点,即该部门的所有员工。 - 点 (.) 选择当前的节点,两个点 (..) 选择父节点。例如,用于选择某个员工所在的部门的 XPath 表达式就是
../employee
。 - 要选择属性,请使用
@
字符。例如,/company/department/employee[@retired]
选择指定了retired
属性的所有员工。