## 拉勾网数据 1. 读取拉勾网数据 2. 统计每一个城市分别有多少条岗位信息 3. 统计出超过30条数据的城市 4. 检索出各个城市中有七险一金的工作,并将这些工作信息拼接到一起输出出来 5. 检索出各个城市中岗位最多的工作,并将这些工作信息拼接到一起输出出来
时间: 2024-05-02 17:17:21 浏览: 123
很好,这是一个数据处理的任务,我们可以使用 Python 中的 pandas 和 numpy 模块来处理数据。以下是解决方案:
```python
import pandas as pd
import numpy as np
# 1. 读取拉勾网数据
data = pd.read_csv('拉勾网数据.csv', encoding='utf-8')
# 2. 统计每一个城市分别有多少条岗位信息
city_counts = data['城市'].value_counts()
print('每个城市的岗位数:')
print(city_counts)
# 3. 统计出超过30条数据的城市
large_cities = city_counts[city_counts > 30].index.tolist()
print('岗位数超过30的城市有:')
print(large_cities)
# 4. 检索出各个城市中有七险一金的工作,并将这些工作信息拼接到一起输出出来
seven_insurance_jobs = data[data['福利'].str.contains('七险一金')]['职位名称'].tolist()
print('有七险一金的工作有:')
print(seven_insurance_jobs)
# 5. 检索出各个城市中岗位最多的工作,并将这些工作信息拼接到一起输出出来
max_jobs_city = city_counts.idxmax()
max_jobs = data[data['城市'] == max_jobs_city]['职位名称'].tolist()
print(f'{max_jobs_city}中岗位最多的工作有:')
print(max_jobs)
```
需要注意的是,这个代码是基于一个名为“拉勾网数据.csv”的文件,你需要将其替换为你自己的数据文件名。
阅读全文