如何获取span内文本
时间: 2024-04-22 12:28:33 浏览: 98
使用 Span 来修改文本样式的优质体验
如果你想要获取HTML中某个span标签内的文本,可以使用lxml库中的xpath语法进行定位并获取。以你提供的代码为例,如果要获取类名为"jobInfo"的span标签内的文本,可以使用以下代码实现:
```python
# 获取类名为"jobInfo"的span标签内的文本
job_info_list = root.xpath('//span[@class="jobInfo"]/text()')
```
解释一下上述代码:
1. `root.xpath()`函数用于在HTML文档中查找匹配某个xpath表达式的所有元素。
2. `//span[@class="jobInfo"]`是一个xpath表达式,表示匹配所有类名为"jobInfo"的span标签。
3. `/text()`是一个xpath表达式,表示获取当前元素的文本内容。
将上述代码放到你提供的代码中,可以这样写:
```python
import re
import requests
from lxml import etree
import numpy as np
import pandas as pd
headers = {
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.162 Safari/537.36'
}
url="https://www.5iai.com/#/jobList"
response = requests.get(url,headers = headers)
response.encoding = 'utf8'
html = response.text
root = etree.HTML(html)
# 获取类名为"jobInfo"的span标签内的文本
job_info_list = root.xpath('//span[@class="jobInfo"]/text()')
print(job_info_list)
```
这样,可以得到所有类名为"jobInfo"的span标签内的文本内容列表。
阅读全文