python使用beautifulsoup爬取51job招聘信息
时间: 2023-10-11 19:14:14 浏览: 135
好的,以下是使用 Python 和 Beautiful Soup 爬取 51job 招聘信息的步骤:
1. 首先,需要安装 `beautifulsoup4` 和 `requests` 库。可以通过以下命令安装:
```
pip install beautifulsoup4 requests
```
2. 导入需要的库:
```
import requests
from bs4 import BeautifulSoup
```
3. 确定需要爬取的页面链接,并将其存储在一个变量中:
```
url = 'https://search.51job.com/list/000000,000000,0000,00,9,99,python,2,1.html'
```
在这个示例中,我们将爬取搜索关键词为“python”的招聘信息。
4. 发送 HTTP 请求获取页面内容:
```
r = requests.get(url)
```
5. 使用 Beautiful Soup 解析页面内容:
```
soup = BeautifulSoup(r.content, 'html.parser')
```
6. 找到每个招聘信息的 HTML 元素,并将它们存储在一个列表中:
```
job_list = soup.find_all('div', {'class': 'el'})
```
7. 遍历列表,提取每个招聘信息中的相关信息,例如职位名称、公司名称、工作地点、薪资等:
```
for job in job_list:
job_name = job.find('a', {'target': '_blank'}).text.strip()
company_name = job.find('a', {'class': 'name'}).text.strip()
location = job.find('span', {'class': 't3'}).text.strip()
salary = job.find('span', {'class': 't4'}).text.strip()
print(job_name, company_name, location, salary)
```
在这个示例中,我们将职位名称、公司名称、工作地点和薪资打印到控制台上。
完整的代码示例:
阅读全文