读取实习僧网站招聘.xlsx数据,完成以下操作: ~将最高工资划分为6个区间,<100,100-200,200-300,300-400,>400,统计各个区间内的数量 ~将最高工资,等频率切分为10份,统计各个区间的数量 ~对edu列进行独热编码,统计各个学历要求的人数
时间: 2024-03-05 12:55:07 浏览: 25
好的,我们可以使用pandas库来读取Excel文件,并使用pandas和numpy库来完成数据处理和分析。以下是代码实现的步骤:
1. 导入所需的库
```python
import pandas as pd
import numpy as np
```
2. 读取Excel文件并查看数据
```python
df = pd.read_excel('实习僧网站招聘.xlsx')
print(df.head())
```
3. 将最高工资划分为6个区间,并统计各个区间内的数量
```python
salary_bins = [0, 100, 200, 300, 400, np.inf]
salary_labels = ['<100', '100-200', '200-300', '300-400', '>400']
df['salary_range'] = pd.cut(df['最高工资'], bins=salary_bins, labels=salary_labels)
salary_counts = df['salary_range'].value_counts()
print(salary_counts)
```
这里我们使用pd.cut()函数将最高工资划分为6个区间,并为每个区间指定一个标签。然后,我们将划分后的数据存储在新的列salary_range中,并使用value_counts()函数统计各个区间内的数量。
4. 将最高工资,等频率切分为10份,并统计各个区间的数量
```python
df['salary_range2'] = pd.qcut(df['最高工资'], q=10)
salary_counts2 = df['salary_range2'].value_counts()
print(salary_counts2)
```
这里我们使用pd.qcut()函数将最高工资等频率切分为10份,并将切分后的数据存储在新的列salary_range2中。然后,我们使用value_counts()函数统计各个区间的数量。
5. 对edu列进行独热编码,并统计各个学历要求的人数
```python
edu_dummies = pd.get_dummies(df['edu'])
edu_counts = edu_dummies.sum()
print(edu_counts)
```
这里我们使用pd.get_dummies()函数对edu列进行独热编码,并将编码后的结果存储在edu_dummies中。然后,我们使用sum()函数统计各个学历要求的人数。
完整的代码如下:
```python
import pandas as pd
import numpy as np
df = pd.read_excel('实习僧网站招聘.xlsx')
print(df.head())
salary_bins = [0, 100, 200, 300, 400, np.inf]
salary_labels = ['<100', '100-200', '200-300', '300-400', '>400']
df['salary_range'] = pd.cut(df['最高工资'], bins=salary_bins, labels=salary_labels)
salary_counts = df['salary_range'].value_counts()
print(salary_counts)
df['salary_range2'] = pd.qcut(df['最高工资'], q=10)
salary_counts2 = df['salary_range2'].value_counts()
print(salary_counts2)
edu_dummies = pd.get_dummies(df['edu'])
edu_counts = edu_dummies.sum()
print(edu_counts)
```
执行代码后,你将会得到最高工资划分为6个区间和等频率切分为10份后的统计结果,以及对edu列进行独热编码后的统计结果。
相关推荐
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)