线性回归分析本地csv数据python代码
时间: 2023-12-28 20:06:11 浏览: 175
下面是一个简单的线性回归分析本地CSV数据的Python代码示例:
```python
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
# 读取CSV文件
data = pd.read_csv('data.csv')
# 准备数据
x = data['x'].values.reshape(-1, 1)
y = data['y'].values.reshape(-1, 1)
# 将数据分为训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=0)
# 创建线性回归模型
model = LinearRegression()
# 训练模型
model.fit(x_train, y_train)
# 预测测试集结果
y_pred = model.predict(x_test)
# 打印结果
print('Coefficients:', model.coef_)
print('Intercept:', model.intercept_)
print('Mean squared error:', np.mean((y_pred - y_test) ** 2))
```
这里假设CSV文件名为"data.csv",包含两列数据"x"和"y"。首先通过Pandas库读取CSV文件,然后将"x"和"y"列的数据分别赋值给变量x和y。接着使用train_test_split函数将数据集分为训练集和测试集,其中test_size参数指定测试集的大小,random_state参数用于指定随机种子。然后创建一个LinearRegression对象,使用fit函数训练模型,使用predict函数预测测试集结果。最后打印出模型的系数、截距和均方误差。
阅读全文