用python写一个薪资预测模型,就学历和工作经验两个维度进行模型训练,尝试做工资预测,请给出具体代码
时间: 2024-02-11 14:09:43 浏览: 37
好的,以下是一个简单的用Python实现的薪资预测模型,基于学历和工作经验两个维度进行模型训练:
```python
# 导入必要的库
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 读取数据
data = pd.read_csv('salary.csv')
# 提取特征
X = data.iloc[:, :-1].values
# 提取标签
y = data.iloc[:, 1].values
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 训练模型
regressor = LinearRegression()
regressor.fit(X_train, y_train)
# 预测结果
y_pred = regressor.predict(X_test)
# 输出均方误差
print('均方误差: ', mean_squared_error(y_test, y_pred))
# 预测新数据
new_data = np.array([[5, 8]])
new_pred = regressor.predict(new_data)
print('预测结果: ', new_pred)
```
其中,'salary.csv'文件包含了学历和薪资水平的数据,格式如下:
```
Education,Salary
1,20000
2,30000
3,40000
4,50000
5,60000
```
代码中使用的是线性回归模型,可以通过修改模型类型或参数来尝试不同的算法和模型。同时,也可以添加更多的特征来提高模型的预测准确度。