logistic模型显著性检验的例题
时间: 2023-09-27 14:11:19 浏览: 66
Logistic模型及建模作业流程概述.doc
假设我们有一个二分类的 logistic 回归模型,我们想要进行显著性检验,看看这个模型是否能够有效地区分两个不同的类别。下面是一个简单的例子:
假设我们有一个数据集,其中包含了一些人的性别和他们是否购买了某个产品的信息。我们想要使用 logistic 回归模型来预测一个人是否会购买该产品,并且想要进行显著性检验,看看这个模型是否有效。
首先,我们需要运行 logistic 回归模型,然后检查模型的系数和截距项是否显著不为零。如果一个系数或截距项的 p 值小于我们选择的显著性水平(通常是 0.05),那么我们就可以认为这个系数或截距项是显著的,即我们可以拒绝它们等于零的假设。
例如,假设我们运行了一个 logistic 回归模型,其中我们使用性别和年龄作为预测变量来预测一个人是否会购买该产品。我们可以得到以下的模型输出:
```
Call:
glm(formula = Bought ~ Gender + Age, family = "binomial", data = Data)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.4361 -0.8101 -0.4778 0.8448 2.3113
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.980e-01 2.311e-01 -0.857 0.391454
GenderMale 1.034e+00 2.309e-01 4.479 7.50e-06 ***
Age 3.982e-02 9.933e-03 4.008 6.08e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 228.08 on 199 degrees of freedom
Residual deviance: 196.42 on 197 degrees of freedom
AIC: 202.42
Number of Fisher Scoring iterations: 5
```
从输出中,我们可以看到,`GenderMale` 和 `Age` 系数的 p 值都小于 0.05,因此我们可以认为它们是显著的。这意味着性别和年龄这两个变量可以有效地区分两个不同的类别。同时,截距项的 p 值大于 0.05,因此我们不能拒绝截距项等于零的假设,即截距项不显著。
综上所述,我们可以得出结论,性别和年龄这两个变量可以有效地预测一个人是否会购买该产品,而截距项则没有显著的影响。
阅读全文