写一个爬取51job网站数据的代码
时间: 2023-09-12 15:08:06 浏览: 107
以下是一个简单的 Python 爬虫,可以爬取 51job 网站的职位信息:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://search.51job.com/list/010000,000000,0000,00,9,99,python,2,1.html'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
job_list = soup.find_all('div', class_='el')
for job in job_list:
job_name = job.find('a').text.strip()
company_name = job.find('span', class_='t2').text.strip()
location = job.find('span', class_='t3').text.strip()
salary = job.find('span', class_='t4').text.strip()
print(f'{job_name} | {company_name} | {location} | {salary}')
```
这个代码会爬取 51job 网站的 Python 职位信息,并输出职位名称、公司名称、工作地点和薪资。你可以根据需要修改代码来爬取其他关键词或更多信息。注意,爬虫需要遵守网站的 robots.txt 文件,不要过于频繁地爬取同一个页面。
阅读全文