首页写一个爬取boss的代码

写一个爬取boss的代码

时间: 2023-12-01 15:32:48 浏览: 29

以下是一个简单的Python爬虫脚本，可以爬取boss直聘网站上的职位信息： ```python import requests from bs4 import BeautifulSoup # 定义请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 定义要爬取的页面链接 url = 'https://www.zhipin.com/job_detail/?query=Python&city=101010100&industry=&position=' # 发送请求 response = requests.get(url, headers=headers) # 解析响应内容 soup = BeautifulSoup(response.text, 'html.parser') job_list = soup.find_all('div', class_='job-list') # 循环遍历每一个职位信息 for job in job_list: job_name = job.find('div', class_='job-title').text.strip() company_name = job.find('div', class_='company-text').find('h3').text.strip() salary = job.find('span', class_='red').text.strip() job_desc = job.find('div', class_='info-primary').find('p').text.strip() # 打印职位信息 print('职位名称：', job_name) print('公司名称：', company_name) print('薪资：', salary) print('职位描述：', job_desc) print('-----------------------------------------') ``` 这个脚本使用requests库发送请求，使用BeautifulSoup库解析HTML响应内容，然后循环遍历每一个职位信息，打印出职位名称、公司名称、薪资以及职位描述等信息。需要注意的是，这个脚本只能爬取第一页的职位信息，如果要爬取更多页的信息，需要对链接进行相应的修改。