statsmodels 线性回归
时间: 2024-10-12 20:10:57 浏览: 27
python 调用 statsmodels 实现多元线性回归
`statsmodels`是一个强大的Python统计分析库,它专注于经济、金融和统计建模。其中,线性回归是其最常用的功能之一。statsmodels的`LinearRegression`模块允许用户拟合一元或多元线性模型,即输入变量(自变量)与单个因变量之间的关系。它支持普通最小二乘法(OLS),也称为简单线性回归,以及更复杂的情况如岭回归和lasso回归。
以下是使用`statsmodels`进行线性回归的基本步骤:
1. 导入必要的模块:
```python
import statsmodels.api as sm
from statsmodels.formula.api import ols
```
2. 准备数据集,通常包含因变量和自变量:
```python
data = ... # 例如pandas DataFrame
X = data[['feature1', 'feature2']] # 自变量
y = data['target'] # 因变量
```
3. 使用`ols()`函数创建模型并拟合数据:
```python
model = ols('y ~ X', data).fit()
```
4. 检查模型摘要信息,包括系数、截距、R^2等统计量:
```python
print(model.summary())
```
5. 可以通过`.predict()`方法对新数据进行预测:
```python
new_data = ... # 新的自变量数据
predictions = model.predict(new_data)
```
阅读全文