员工离职预测数据标准化代码python
时间: 2023-09-14 11:03:50 浏览: 120
Python数据分析与可视化项目职场类-分析员工过早离职原因-约300行(相关性分析、变量分析、plotly可视化).zip
5星 · 资源好评率100%
下面是员工离职预测数据标准化的 Python 代码示例:
```python
import pandas as pd
from sklearn.preprocessing import StandardScaler
# 读取 CSV 文件
df = pd.read_csv('employee_data.csv')
# 选择需要标准化的列
cols_to_scale = ['age', 'salary', 'years_of_experience']
# 创建标准化器对象
scaler = StandardScaler()
# 在数据集上拟合标准化器
scaler.fit(df[cols_to_scale])
# 使用标准化器转换数据集
df[cols_to_scale] = scaler.transform(df[cols_to_scale])
# 将标准化后的数据集保存为新的 CSV 文件
df.to_csv('employee_data_standardized.csv', index=False)
```
在这个例子中,我们使用了 Pandas 库来读取员工数据的 CSV 文件。我们选择需要标准化的列,创建一个 `StandardScaler` 对象,然后对数据集进行拟合和转换。最后,我们将标准化后的数据集保存为一个新的 CSV 文件。
请注意,这个示例需要安装 `pandas` 和 `scikit-learn` 库。
阅读全文