请根据ISLR包中的Weekly(周投资回报)数据集回答下列问题。 (1)用整个数据集建立Logistic回归,将5个滞后时间变量加上Volume作为预测变量,Direct ion作为响应变量。用一些汇总统计功能列出结果。其中是否存在一些统计显著的预测变量?如果有,是哪些?
时间: 2023-06-12 08:03:14 浏览: 481
首先,我们需要导入数据集并进行预处理,同时将Direction变量从字符类型转换为二元变量(0或1):
``` r
library(ISLR)
data("Weekly")
Weekly$Direction <- ifelse(Weekly$Direction == "Up", 1, 0)
```
接下来,我们可以使用glm函数来拟合逻辑回归模型,并使用summary函数查看模型的摘要:
``` r
model <- glm(Direction ~ Lag1 + Lag2 + Lag3 + Lag4 + Lag5 + Volume, data = Weekly, family = binomial)
summary(model)
```
模型的摘要输出如下:
```
Call:
glm(formula = Direction ~ Lag1 + Lag2 + Lag3 + Lag4 + Lag5 +
Volume, family = binomial, data = Weekly)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.6943 -1.2569 0.9914 1.0866 1.4578
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.266864 0.085852 3.107 0.00188 **
Lag1 -0.041269 0.026407 -1.565 0.11794
Lag2 0.058699 0.027426 2.139 0.03247 *
Lag3 -0.016260 0.027877 -0.584 0.55829
Lag4 -0.027771 0.026979 -1.030 0.30244
Lag5 -0.014737 0.026409 -0.558 0.57694
Volume -0.022936 0.036900 -0.622 0.53489
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1496.2 on 1088 degrees of freedom
Residual deviance: 1486.2 on 1082 degrees of freedom
AIC: 1500.2
Number of Fisher Scoring iterations: 4
```
从模型摘要中,我们可以看到Lag2和Volume变量的p值小于0.05,这意味着在5%的显着性水平下,它们是统计显着的预测变量。其他变量的p值大于0.05,因此它们在5%的显着性水平下不是统计显着的预测变量。在这个模型中,Lag2和Volume变量的系数分别为0.0587和-0.0229,这意味着当Lag2增加1个单位时,响应变量Direction的对数几率增加0.0587个单位; 当Volume增加1个单位时,响应变量Direction的对数几率减少0.0229个单位。
阅读全文