python 数据集预测代码
时间: 2023-10-14 13:09:19 浏览: 43
以下是一个简单的Python代码示例,用于使用线性回归模型预测给定数据集的输出:
```python
# 导入必要的库
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
# 读取数据集
data = pd.read_csv('dataset.csv')
# 划分数据集,将80%用于训练,20%用于测试
X_train, X_test, y_train, y_test = train_test_split(data.iloc[:, :-1], data.iloc[:, -1], test_size=0.2, random_state=0)
# 创建线性回归模型并进行拟合
regressor = LinearRegression()
regressor.fit(X_train, y_train)
# 输出模型的截距和系数
print('Intercept:', regressor.intercept_)
print('Coefficients:', regressor.coef_)
# 对测试数据进行预测并输出预测结果
y_pred = regressor.predict(X_test)
print('Predicted values:', y_pred)
```
其中,`dataset.csv`是给定的数据集文件,包含所有的输入变量和输出变量。代码将该文件读入一个Pandas DataFrame中,并将数据集划分为80%的训练数据和20%的测试数据。然后,使用训练数据拟合一个线性回归模型,并输出模型的截距和系数。最后,使用该模型对测试数据进行预测,并输出预测结果。