生成自变量为定量变量,因变量既有定量变量也有定类变量的回归模型python代码
时间: 2024-03-09 18:47:55 浏览: 46
以下是生成自变量为定量变量,因变量既有定量变量也有定类变量的回归模型python代码的示例:
```python
import pandas as pd
import statsmodels.api as sm
# 生成示例数据
data = {'age': [22, 25, 30, 35, 40],
'income': [2000, 2500, 3000, 3500, 4000],
'gender': ['Male', 'Female', 'Male', 'Male', 'Female'],
'score': [80, 85, 90, 95, 100]}
df = pd.DataFrame(data)
# 将定类变量转换为哑变量
df = pd.get_dummies(df, columns=['gender'])
# 拟合回归模型
X = df[['age', 'income', 'gender_Female', 'gender_Male']]
y = df['score']
X = sm.add_constant(X)
model = sm.OLS(y, X).fit()
# 输出回归结果
print(model.summary())
```
在上述示例代码中,我们首先生成了一组示例数据,其中包含了一个定量自变量“age”、一个定量自变量“income”和一个定类因变量“gender”,以及一个定量因变量“score”。我们使用`pd.get_dummies()`将“gender”列转换为哑变量,并将其添加到自变量中。然后,我们使用`sm.OLS()`拟合一个多元回归模型,其中包含了所有自变量和截距项。最后,我们使用`model.summary()`输出回归结果,包括每个自变量的系数、截距项、R-squared值、调整后的R-squared值等等。
阅读全文