读取CSV文件,数据类型是int64,其中薪资这一列里面有月/千,月/万,年/千,年/万,天/元。怎样处理薪资这一列
时间: 2023-07-01 11:26:54 浏览: 83
处理薪资这一列需要进行以下几个步骤:
1. 将所有薪资单位统一转换为月薪,并将其转化为整数类型。
2. 对于包含“千”的薪资,需要将其数字乘以1000后再除以相应的时间单位(月、年、天)。
3. 对于包含“万”的薪资,需要将其数字乘以10000后再除以相应的时间单位(月、年、天)。
4. 对于包含“元”的薪资,需要将其数字除以相应的时间单位(月、年、天)。
下面是一个 Python 代码示例:
```python
import pandas as pd
# 读取 CSV 文件
df = pd.read_csv('salary.csv')
# 定义一个函数,用于将薪资转换为月薪
def convert_salary(s):
if '千' in s:
return int(float(s.replace('千', '')) * 1000 / 12)
elif '万' in s:
return int(float(s.replace('万', '')) * 10000 / 12)
elif '元' in s:
return int(float(s.replace('元', '')) / 30)
else:
return int(s)
# 对薪资列进行转换
df['salary'] = df['salary'].apply(convert_salary)
# 输出处理后的结果
print(df.head())
```
这个代码示例假定 CSV 文件中的薪资列名称为 "salary",可以根据实际情况进行修改。
阅读全文