写一个读入csv文件的构建线性回归模型并输出模型评价的python代码
时间: 2024-05-04 08:20:15 浏览: 179
数据分析实战 - 线性回归-女性身高与体重数据分析
以下是一个简单的读入csv文件并使用线性回归模型进行预测并输出评价指标的Python代码:
```python
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
# 读入CSV文件
data = pd.read_csv('data.csv')
# 将数据集分为训练集和测试集
train_data = data.iloc[:80]
test_data = data.iloc[80:]
# 构建特征矩阵和目标向量
X_train = train_data.drop('y', axis=1)
y_train = train_data['y']
X_test = test_data.drop('y', axis=1)
y_test = test_data['y']
# 构建线性回归模型
model = LinearRegression()
# 训练模型
model.fit(X_train, y_train)
# 预测测试集结果
y_pred = model.predict(X_test)
# 输出模型评价指标
print('均方误差: %.2f' % mean_squared_error(y_test, y_pred))
print('决定系数: %.2f' % r2_score(y_test, y_pred))
```
这里假设数据集中有一个名为"data.csv"的CSV文件,其中包含特征和目标变量。通过使用Pandas库的read_csv函数,我们可以将数据读入到一个名为"data"的Pandas DataFrame中。然后,我们将数据集分为训练集和测试集,并使用特征矩阵和目标向量构建线性回归模型。最后,我们使用测试集对模型进行评估,并输出均方误差和决定系数两个评价指标。
阅读全文