写一个大学毕业生收入预测的机器学习模型的代码
时间: 2024-10-24 09:08:41 浏览: 12
构建一个大学毕业生收入预测的机器学习模型通常涉及到数据预处理、特征选择、模型训练和评估等步骤。这里我们以Python和常用的Scikit-learn库为例,展示一个简单的线性回归模型作为基础示例。假设我们已经有了毕业生的数据集,包括年龄、学历、工作经验等因素作为输入特征(X),以及他们的年薪作为目标变量(y)。
```python
# 导入所需库
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
# 加载数据(假设数据存储在CSV文件中)
data = pd.read_csv('graduate_income.csv')
# 数据预处理:缺失值处理、编码分类变量等
# 这里简单假设没有缺失值,如果有,可以使用fillna()或dropna()
# 对于类别变量,可以使用get_dummies()进行独热编码
X = data.drop(['income'], axis=1) # 输入特征
y = data['income'] # 目标变量
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练线性回归模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测测试集结果
y_pred = model.predict(X_test)
# 评估模型性能
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Mean Squared Error: {mse}")
print(f"R^2 Score: {r2}")
#
阅读全文