爬取智联招聘python
时间: 2023-11-17 21:06:34 浏览: 103
Python爬虫爬取智联招聘
为了爬取智联招聘上的Python职位信息,我们可以使用Python中的requests和BeautifulSoup库。具体步骤如下:
1.分析网页结构,找到需要爬取的信息所在的标签和类名。
2.使用requests库向目标网页发送请求,获取网页源代码。
3.使用BeautifulSoup库解析网页源代码,提取需要的信息。
4.将提取的信息保存到本地文件或数据库中。
下面是一个简单的示例代码,可以爬取智联招聘上的Python职位信息并将其保存到本地文件中:
```python
import requests
from bs4 import BeautifulSoup
# 设置请求头,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 构造请求URL
url = 'https://sou.zhaopin.com/?jl=530&kw=python&kt=3'
# 发送请求,获取网页源代码
response = requests.get(url, headers=headers)
html = response.text
# 解析网页源代码,提取需要的信息
soup = BeautifulSoup(html, 'html.parser')
job_list = soup.find_all('div', {'class': 'joblist-box__item clearfix'})
# 将提取的信息保存到本地文件中
with open('job_list.txt', 'w', encoding='utf-8') as f:
for job in job_list:
job_name = job.find('a', {'class': 'jobname'}).text.strip()
company_name = job.find('a', {'class': 'company_title'}).text.strip()
salary = job.find('span', {'class': 'red'}).text.strip()
f.write(f'{job_name}\t{company_name}\t{salary}\n')
```
阅读全文