python中xpath用法大全
时间: 2024-04-24 17:26:09 浏览: 74
Python Xpath 的使用
XPath是一种用于在XML和HTML文档中定位节点的语言。在Python中,使用lxml库来解析和处理XML和HTML文档,并使用XPath表达式来选择和提取节点。下面是一些常见的XPath用法示例:
1. 选择节点:
- 选择所有节点:`//*`
- 选择指定节点:`//tagname`,例如:`//div`
- 选择具有指定属性的节点:`//tagname[@attribute='value']`,例如:`//a[@href='http://example.com']`
2. 选择父节点、子节点和后代节点:
- 选择父节点:`/..`
- 选择子节点:`/tagname`
- 选择后代节点:`//tagname`
3. 选择特定位置的节点:
- 选择第一个匹配的节点:`(//tagname)[1]`
- 选择最后一个匹配的节点:`(//tagname)[last()]`
- 选择前n个匹配的节点:`(//tagname)[position() <= n]`
4. 选择具有特定文本内容的节点:
- 选择包含指定文本的节点:`//tagname[text()='text']`,例如:`//p[text()='Hello World']`
- 选择文本以指定字符串开头的节点:`//tagname[starts-with(text(), 'prefix')]`
5. 选择具有特定属性的节点:
- 选择具有指定属性的节点:`//tagname[@attribute]`
- 选择具有特定属性且属性值以指定字符串开头的节点:`//tagname[starts-with(@attribute, 'prefix')]`
6. 使用通配符选择节点:
- 选择任意节点:`//*`
- 选择任意子节点:`//tagname/*`
- 选择当前节点的所有属性:`@*`
这些只是XPath的一些常见用法示例,XPath还有更多强大的功能和语法,可以根据具体需求灵活运用。在Python中,可以使用lxml库的`xpath()`方法来执行XPath查询,例如:
```python
from lxml import etree
# 解析HTML文档
html = etree.parse("example.html")
# 执行XPath查询
nodes = html.xpath("//div[@class='content']")
for node in nodes:
print(node.text)
```
以上是一些基本的XPath用法,你可以根据自己的需求进一步学习和使用XPath来处理XML和HTML文档中的节点。
阅读全文