基于某一数据集,构建线性回归模型,对数据进行预测。(请对代码添加注释)
时间: 2024-10-13 15:19:08 浏览: 43
在Python中,我们可以使用scikit-learn库来构建基于线性回归的数据预测模型。下面是一个简单的示例,包括加载数据、拆分数据集、创建模型、训练模型以及进行预测:
```python
# 导入所需的库
import pandas as pd
from sklearn.model_selection import train_test_split # 数据集分割
from sklearn.linear_model import LinearRegression # 线性回归模型
from sklearn import metrics # 评估指标
# 加载数据集(这里假设数据在一个CSV文件中)
data = pd.read_csv('your_data.csv') # 将'your_data.csv'替换为实际数据集路径
# 定义特征变量X和目标变量y
X = data.drop('target_column', axis=1) # 'target_column'替换成实际的目标列名
y = data['target_column'] # 目标变量
# 划分训练集和测试集,通常比例为80%训练, 20%测试
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建线性回归模型实例
model = LinearRegression()
# 训练模型
model.fit(X_train, y_train) # 使用训练数据拟合模型
# 进行预测
predictions = model.predict(X_test)
# 评估模型性能
r2_score = metrics.r2_score(y_test, predictions)
mse = metrics.mean_squared_error(y_test, predictions)
print(f"R²分数: {r2_score}, 平均平方误差(MSE): {mse}")
#
阅读全文