首页python 数据集预测代码

python 数据集预测代码

时间: 2023-10-14 13:09:19 浏览: 43

以下是一个简单的Python代码示例，用于使用线性回归模型预测给定数据集的输出： ```python # 导入必要的库 import pandas as pd import numpy as np from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split # 读取数据集 data = pd.read_csv('dataset.csv') # 划分数据集，将80%用于训练，20%用于测试 X_train, X_test, y_train, y_test = train_test_split(data.iloc[:, :-1], data.iloc[:, -1], test_size=0.2, random_state=0) # 创建线性回归模型并进行拟合 regressor = LinearRegression() regressor.fit(X_train, y_train) # 输出模型的截距和系数 print('Intercept:', regressor.intercept_) print('Coefficients:', regressor.coef_) # 对测试数据进行预测并输出预测结果 y_pred = regressor.predict(X_test) print('Predicted values:', y_pred) ``` 其中，`dataset.csv`是给定的数据集文件，包含所有的输入变量和输出变量。代码将该文件读入一个Pandas DataFrame中，并将数据集划分为80%的训练数据和20%的测试数据。然后，使用训练数据拟合一个线性回归模型，并输出模型的截距和系数。最后，使用该模型对测试数据进行预测，并输出预测结果。