python爬取51job代码
时间: 2023-10-09 20:11:06 浏览: 156
您好!以下是一个简单的 Python 爬取 51Job 网站的代码示例:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.51job.com/'
params = {
'keyword': '数据分析',
'jobarea': '020000'
}
response = requests.get(url, params=params)
soup = BeautifulSoup(response.text, 'html.parser')
job_list = soup.find_all('div', class_='el')
for job in job_list:
job_title = job.find('a', class_='title')['title']
company_name = job.find('a', class_='name')['title']
job_salary = job.find('span', class_='t4').text.strip()
job_addr = job.find('span', class_='t3').text.strip()
print(f'职位:{job_title},公司名:{company_name},薪水:{job_salary},工作地点:{job_addr}')
```
希望这能帮到您!如果您有其它问题,欢迎继续提问。
相关问题
python爬取51job公司名称
以下是使用Python爬取51job公司名称的示例代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://search.51job.com/list/000000,000000,0000,00,9,99,python,2,1.html'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
res = requests.get(url, headers=headers)
soup = BeautifulSoup(res.text, 'html.parser')
company_names = soup.select('.dw_table .el .t2 a')
for name in company_names:
print(name.text)
```
解析:
1.首先,我们需要导入requests和BeautifulSoup库。
2.将目标网址存储在变量url中。
3.设置请求标头,以避免被服务器拒绝访问。
4.使用requests库发送GET请求,将响应存储在变量res中。
5.使用BeautifulSoup库解析响应文本,将结果存储在变量soup中。
6.使用CSS选择器获取公司名称元素,将结果存储在变量company_names中。
7.遍历company_names,打印每个元素的文本内容。
这段代码将打印出第一页中所有公司的名称。您可以更改url以获取其他页中的公司名称。
使用python爬取51job招聘信息
1. 首先需要安装requests和beautifulsoup4两个库,可以使用pip install requests和pip install beautifulsoup4命令进行安装。
2. 导入需要使用的库。
```
import requests
from bs4 import BeautifulSoup
```
3. 使用requests库向51job网站发送请求,并获取网页内容。
```
url = 'https://search.51job.com/list/000000,000000,0000,00,9,99,Python,2,1.html'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
html = response.text
```
4. 使用BeautifulSoup库解析网页内容,并获取需要的招聘信息。
```
soup = BeautifulSoup(html, 'html.parser')
job_list = soup.find_all('div', class_ = 'el')
for job in job_list:
job_name = job.find('a', attrs={'target': '_blank'}).text.strip()
company_name = job.find('a', attrs={'class': 'name'}).text.strip()
salary = job.find('span', attrs={'class': 't4'}).text.strip()
location = job.find('span', attrs={'class': 't3'}).text.strip()
release_time = job.find('span', attrs={'class': 't5'}).text.strip()
print('职位名称:', job_name)
print('公司名称:', company_name)
print('工资待遇:', salary)
print('工作地点:', location)
print('发布时间:', release_time)
print('-----------------------------------------------')
```
完整代码如下:
```
import requests
from bs4 import BeautifulSoup
url = 'https://search.51job.com/list/000000,000000,0000,00,9,99,Python,2,1.html'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
job_list = soup.find_all('div', class_ = 'el')
for job in job_list:
job_name = job.find('a', attrs={'target': '_blank'}).text.strip()
company_name = job.find('a', attrs={'class': 'name'}).text.strip()
salary = job.find('span', attrs={'class': 't4'}).text.strip()
location = job.find('span', attrs={'class': 't3'}).text.strip()
release_time = job.find('span', attrs={'class': 't5'}).text.strip()
print('职位名称:', job_name)
print('公司名称:', company_name)
print('工资待遇:', salary)
print('工作地点:', location)
print('发布时间:', release_time)
print('-----------------------------------------------')
```
阅读全文