写一个爬取boss的代码
时间: 2023-12-01 19:32:48 浏览: 72
以下是一个简单的Python爬虫脚本,可以爬取boss直聘网站上的职位信息:
```python
import requests
from bs4 import BeautifulSoup
# 定义请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 定义要爬取的页面链接
url = 'https://www.zhipin.com/job_detail/?query=Python&city=101010100&industry=&position='
# 发送请求
response = requests.get(url, headers=headers)
# 解析响应内容
soup = BeautifulSoup(response.text, 'html.parser')
job_list = soup.find_all('div', class_='job-list')
# 循环遍历每一个职位信息
for job in job_list:
job_name = job.find('div', class_='job-title').text.strip()
company_name = job.find('div', class_='company-text').find('h3').text.strip()
salary = job.find('span', class_='red').text.strip()
job_desc = job.find('div', class_='info-primary').find('p').text.strip()
# 打印职位信息
print('职位名称:', job_name)
print('公司名称:', company_name)
print('薪资:', salary)
print('职位描述:', job_desc)
print('-----------------------------------------')
```
这个脚本使用requests库发送请求,使用BeautifulSoup库解析HTML响应内容,然后循环遍历每一个职位信息,打印出职位名称、公司名称、薪资以及职位描述等信息。需要注意的是,这个脚本只能爬取第一页的职位信息,如果要爬取更多页的信息,需要对链接进行相应的修改。
阅读全文