XPath教程:导航XML文档的路径表达式和函数

需积分: 23 2 下载量 161 浏览量 更新于2024-08-17 收藏 1.28MB PPT 举报
"XPath是XML文档的导航语言,它提供了简洁的路径表达式来选取XML文档中的特定节点或节点集合。XPath的关键术语包括各种类型的节点,如文档节点、元素节点、文本节点、属性节点等。此外,XPath还包含了丰富的标准函数库,用于处理字符串、数值、日期和时间等。XPath在XSLT中扮演着核心角色,是W3C的标准,目的是为了方便XML数据的处理和查询。 1. 节点(Node):XML文档由一系列的节点组成,包括文档节点(根节点)、元素节点、文本节点、属性节点、命名空间节点、处理指令节点和注释节点。根节点是整个XML文档的起点,不包含任何内容,而根元素是文档的第一个元素,属于根节点的子节点。 2. 路径表达式:XPath使用路径表达式来定位XML文档中的节点。这与文件系统的路径类似,允许我们通过节点层次来寻找特定的节点。例如,"/bookstore/book/title" 将选取所有书店元素下的书名元素。 3. 标准函数库:XPath内建了超过100个函数,如字符串处理函数、数值比较函数、日期和时间操作函数等。这些函数极大地增强了XPath的功能,使得数据处理更加灵活。 4. 在XSLT中的应用:XPath是XSLT(可扩展样式表转换语言)的核心部分,XSLT用于转换XML文档。掌握XPath对于创建XSLT文档至关重要,因为XSLT利用XPath来定位源XML文档中的元素并进行转换。 5. W3C标准:XPath自1999年11月16日成为W3C推荐标准,确保了其跨平台和跨工具的兼容性,广泛应用于XML解析软件。 6. 基本值(Atomic value)与项目(Item):基本值是无父节点或子节点的节点表示,如字符串"JK.Rowling"或数字29.99。项目则可以是基本值或节点,是XPath中的基本操作单位。 在示例XML文档中,`<book>` 是元素节点,`lang="en"` 是属性节点,`<title lang="en">Harry Potter</title>` 中的 "Harry Potter" 是文本节点,而 "en" 是属性节点的基本值。通过XPath,我们可以轻松获取这些节点的信息,比如选取所有书籍的作者,可以使用 `//book/author` 的路径表达式。