python爬取boss直聘数据代码
时间: 2023-10-01 08:11:09 浏览: 20
基于大数据对boss直聘进行数据分析及可视化.zip
以下是一个简单的 Python 爬取 Boss 直聘数据的示例代码,使用 requests 和 BeautifulSoup 库:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.zhipin.com/job_detail/?query=python&city=101010100&industry=&position='
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
job_list = soup.find_all('div', {'class': 'job-list'})
for job in job_list:
job_name = job.find('h3').get_text().strip()
company_name = job.find('div', {'class': 'company-text'}).find('h3').get_text().strip()
salary = job.find('span', {'class': 'red'}).get_text().strip()
job_info = job.find('p').get_text().strip()
print(job_name, company_name, salary, job_info)
```
这个示例代码中,我们通过 requests 库发送一个 GET 请求,获取 Boss 直聘的页面内容,然后使用 BeautifulSoup 库解析 HTML,获取到职位名称、公司名称、薪资和职位描述等信息,并最终打印输出。你可以根据自己的需求进行修改和扩展。
阅读全文