爬虫爬取boss直聘信息
时间: 2023-11-14 17:06:26 浏览: 80
爬取boss直聘信息需要使用 Python 编程语言和相关的库,如 requests 和 BeautifulSoup。以下是一个简单的爬虫示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.zhipin.com/job_detail/?query=Python&city=101010100&industry=&position='
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299'
}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
job_list = soup.find_all(class_='job-primary')
for job in job_list:
job_title = job.find('div', class_='job-title').text.strip()
company_name = job.find('div', class_='company-text').h3.a.text.strip()
salary = job.find('span', class_='red').text.strip()
print(job_title, company_name, salary)
```
在这个例子中,我们使用了 requests 库来发送 GET 请求获取网页内容,然后使用 BeautifulSoup 库解析网页内容,最后提取了职位名称、公司名称和薪资信息。注意,这个例子仅作为学习爬虫的示例,爬虫行为需要遵守相关法律法规,切勿用于非法用途。
阅读全文