还要用使用lxml实现数据的解析
时间: 2024-04-03 13:31:57 浏览: 148
Python实现美食数据爬取+数据分析+数据可视化.zip
5星 · 资源好评率100%
是的,您可以使用 lxml 库来解析 HTML 页面中的数据。以下是示例代码:
```python
import requests
from lxml import etree
url = 'https://www.job5156.com/'
params = {
'q': 'Python', # 搜索关键字
'pageSize': 50, # 每页显示数量
'pageNo': 1 # 页码
}
response = requests.get(url + '/zhaopin/search/', params=params)
html = etree.HTML(response.text)
job_list = html.xpath('//div[@class="job-item"]')
for job in job_list:
name = job.xpath('.//div[@class="job-name"]/a/text()')[0].strip()
address = job.xpath('.//div[@class="job-address"]/text()')[0]
requirements = job.xpath('.//div[@class="job-requirements"]/text()')[0]
salary = job.xpath('.//div[@class="job-salary"]/text()')[0]
position = job.xpath('.//div[@class="job-position"]/text()')[0]
print(name, address, requirements, salary, position)
```
这段代码与之前的代码大致相同,不同之处在于使用了 lxml 库来解析 HTML 页面中的数据。`etree.HTML()` 方法可以将 HTML 文本转换为 Element 对象,然后使用 XPath 表达式来获取数据。获取到的数据包括公司名称、地址、招聘要求、工资、招聘岗位等。
阅读全文