logistic regression
Logistic Regression 在 SPSS 中的实现及参数含义 Logistic Regression 是一种常用的分类算法,用于预测二元响应变量的概率。 Logistic Regression 的主要思想是将自变量与因变量之间的关系建模,以预测因变量的概率。 SPSS 提供了强大的 Logistic Regression 分析工具,可以轻松地实现 Logistic Regression 分析。 参数含义 1. Dependent Variable(因变量):表示需要预测的变量,通常为二元变量(0/1,Yes/No 等)。 2. Independent Variables(自变量):表示影响因变量的变量,通常为连续变量或分类变量。 3. Coefficients(回归系数):表示自变量对因变量的影响程度。 4. Odds Ratio(比值):表示自变量每增加一个单位,对因变量的影响程度。 5. Wald Chi-Square(Wald χ²):表示自变量的重要性检验结果。 6. P-Value(p 值):表示自变量的重要性检验结果,通常小于 0.05 则认为该自变量对因变量有显著影响。 7. Classification Table(分类表):显示预测结果与实际结果的对比情况。 8. Hosmer-Lemeshow Goodness-of-Fit Test(拟合优度检验):用于检验模型的拟合优度。 9. Correlations of Estimations(估计参数相关矩阵):显示估计参数之间的相关关系。 SPSS 操作方法 1. 选择 Analyze → Regression → Binary Logistic,打开 Logistic Regression 对话框。 2. 选择因变量 Y 进入 Dependent 框内,将自变量选择进入 Covariates 框。 3. 在 Method 框内选择自变量的筛选策略,例如,Enter、Forward、Backward 等。 4. 在 Selection 框内选择一个变量作为条件变量。 5. 单击 Categorical 打开 Categorical 对话框,以选择定性变量的参照类。 6. 单击 Option 按钮,打开 Option 对话框,以选择输出图和分析结果。 7. 单击 Save 按钮,打开 Save 对话框,以保存预测结果到数据窗口。 应用实例 在本例中,我们使用 Logistic Regression 分析了一个关于公共交通的社会调查结果。自变量 X1、X2、X3 分别表示年龄、月收入和性别,分别对因变量 Y(是否选择乘公交车上下班)进行分析。结果表明,自变量 X1、X2 均对因变量 Y 有显著影响。 结论 Logistic Regression 是一种强大的分类算法,广泛应用于社会科学、医学、金融等领域。通过 SPSS 软件,可以轻松地实现 Logistic Regression 分析,并对结果进行解释和应用。