XPath语法全解析：从基础到高级应用

需积分: 9 38 浏览量更新于2024-07-24 收藏 120KB DOC 举报

"XPath语法详解" XPath（XML Path Language）是一种在XML文档中查找信息的语言，它被设计用来选取XML文档中的节点，包括元素、属性、文本等。XPath使用路径表达式来选取XML文档中的节点，这些路径表达式类似于文件系统的路径。在实例1中，我们看到了XPath路径的基本用法： - `/AAA` 表示选取XML文档的根元素`<AAA>`。 - `/AAA/CCC` 表示选取根元素`<AAA>`下的所有`<CCC>`子元素。 - `/AAA/DDD/BBB` 则选取`<AAA>`的子元素`<DDD>`下的所有`<BBB>`子元素。实例2展示了路径以双斜线`//`开头的情况： - `//BBB` 选取文档中所有名为`<BBB>`的元素，不论它们在什么层级。 - `//DDD/BBB` 则选取所有父元素为`<DDD>`的`<BBB>`元素。实例3中，星号`*`是一个通配符： - `/AAA/CCC/DDD/*` 选取所有属于`<DDD>`子元素的直接子节点，无论它们是什么标签名。除了这些基础操作，XPath还有更丰富的语法： - `@attribute_name` 用于选取属性，例如`//element[@attr='value']`选取所有`attr`属性值为`value`的`element`元素。 - `text()` 函数选取元素的文本内容，如`//element/text()`。 - `.` 代表当前节点，而`..`表示父节点。 - `[]` 用于过滤条件，如`//element[condition]`选取满足条件的`element`元素。 - `*` 和 `+` 可以用于组合路径，`//element1/*`选取所有`element1`的子元素，`//element1[element2]`选取包含`element2`子元素的`element1`。 - `last()` 和 `position()` 函数用于获取当前节点在兄弟节点中的位置，例如`//element[position()=last()]`选取最后一个`element`元素。 XPath还支持算术运算、字符串函数、布尔运算等，使其在处理XML数据时具有很高的灵活性和实用性。通过熟练掌握XPath，可以高效地导航XML结构，进行数据提取和处理。

/AAA/BBB[last()]

选择 AAA 的最后一个 BBB 子元素

<AAA>

<BBB/>

</AAA>

实例 5

//@id

选择所有的 id 属性

<AAA>

<BBB id = "b1"/>

<BBB id = "b2"/>

<BBB name = "bbb"/>

<BBB/>

</AAA>



//BBB[@id]

选择有 id 属性的 BBB 元素

<AAA>

<BBB id = "b1"/>

<BBB id = "b2"/>

<BBB name = "bbb"/>

<BBB/>

</AAA>



//BBB[@name]

选择有 name 属性的 BBB 元素

剩余32页未读，继续阅读

apache-bbccb

粉丝: 24
资源: 77

XPath语法全解析：从基础到高级应用

Python3 xml.etree.ElementTree支持的XPath语法详解

XPath语法详解xml开发必备

Python解析XML：XPath语法详解

解析XPath语法之在C#中使用XPath的示例详解

Python爬虫基础之XPath语法与lxml库的用法详解

xpath语法与函数

Selenium_XPath定位详解

【爬虫学得好，基础少不了】：XPath语法和lxml模块(详解)

C#操作xml之xpath语法

XPath语法实例详解：定位与选择元素

最新资源