python xpath用法
时间: 2023-11-21 19:55:09 浏览: 118
以下是Python中使用XPath的基本用法:
1. 导入lxml库和requests库
```python
import requests
from lxml import etree
```
2. 发送请求并获取HTML文本
```python
url = 'http://example.com'
response = requests.get(url)
html = response.text
```
3. 解析HTML文本并使用XPath进行定位
```python
# 将HTML文本转换为Element对象
selector = etree.HTML(html)
# 使用XPath定位元素
# 获取所有a标签的href属性
links = selector.xpath('//a/@href')
# 获取第一个h1标签的文本内容
title = selector.xpath('//h1/text()')[0]
```
4. XPath语法实例应用
```python
# 获取所有p标签的文本内容
p_list = selector.xpath('//p/text()')
# 获取第一个div标签的class属性值
div_class = selector.xpath('//div/@class')[0]
# 获取第二个ul标签下的所有li标签的文本内容
li_list = selector.xpath('//ul[2]/li/text()')
# 获取所有class属性值为'item'的div标签下的a标签的href属性
a_list = selector.xpath('//div[@class="item"]//a/@href')
```
阅读全文