怎么用pandas进行多元线性回归
时间: 2024-02-09 13:36:34 浏览: 127
使用Pandas进行多元线性回归的一般步骤如下:
1.导入所需库
```
import pandas as pd
import numpy as np
import statsmodels.api as sm
```
2.准备数据
```
data = pd.read_csv('data.csv') # 从csv文件中读取数据
X = data[['x1', 'x2', 'x3']] # 自变量
y = data['y'] # 因变量
```
3.添加截距项
```
X = sm.add_constant(X) # 添加常数项
```
4.建立模型
```
model = sm.OLS(y, X).fit() # OLS模型
```
5.输出结果
```
print(model.summary())
```
完整代码示例:
```
import pandas as pd
import numpy as np
import statsmodels.api as sm
data = pd.read_csv('data.csv')
X = data[['x1', 'x2', 'x3']]
y = data['y']
X = sm.add_constant(X)
model = sm.OLS(y, X).fit()
print(model.summary())
```
其中,`data.csv`是存储数据的CSV文件,`x1`、`x2`、`x3`是自变量,`y`是因变量。`sm.add_constant()`函数是为了添加常数项,`sm.OLS()`函数是建立OLS模型。最后,使用`model.summary()`函数输出回归结果。
阅读全文