XPath教程:节点、表达式与实例详解

需积分: 9 1 下载量 200 浏览量 更新于2024-09-11 收藏 1.69MB DOC 举报
XPath教程详解 XPath是一种强大的语言,用于在XML和HTML文档中定位和选取数据。它将XML文档视为节点树结构,通过路径表达式进行导航。以下是XPath教程中的关键知识点: 1. 节点类型与关系: - 节点:XML文档中的基本组成单元,包括元素、属性、文本、命名空间、处理指令、注释及根节点(文档节点)。 - 基本值/原子值:无父或子的节点,如元素的内容或属性值。 - 项目:基本值或节点,例如元素或属性本身。 - 父子关系:元素和属性有自己的父节点,而元素可以有零个、一个或多个子节点。 - 同胞:拥有相同父节点的节点。 - 先辈:节点的祖先,如父、祖父母等。 - 后代:节点的子节点及其所有后代。 2. 选取节点与路径表达式: - XPath使用路径表达式,如`/element`表示从根节点开始选取元素名为`element`的节点。 - 有用的路径表达式包括:元素选取(`.//element`)、属性选取 (`@attribute`)、文本选取 (`//text()`) 等。 - 路径表达式支持组合,如`element[@attr='value']`,查找属性`attr`值为`value`的元素。 3. 谓语与条件选择: - 谓语用于筛选节点,通过方括号[]来表示,如`element[child='value']`选取子节点值为`value`的元素。 - 通配符如`*`和`?`允许选取未知或部分匹配的节点。 4. 选取多个路径: - `|`运算符用于选取多个路径,如`element1|element2`,选取`element1`或`element2`节点。 5. 轴(Axis)与位置路径: - 轴定义了节点集合的相对位置,如`child`, `descendant`, `self`等。 - 绝对位置路径如`/document//element`,相对路径如`.//element`。 - 步(step)由轴、节点测试和可选的谓语组成,如`child::element[@attr=value]`。 6. XML实例文档: - 教程中通常会提供一个XML文档作为示例,帮助读者理解和应用XPath表达式。 通过学习XPath,用户能够有效地从复杂的数据结构中提取所需的信息,这对于数据分析、网页抓取、文档处理等领域至关重要。掌握XPath不仅可以提升工作效率,也是理解XML和Web技术架构的基础。