SPSS判别分析实战教程:构建企业分类准则

需积分: 48 3 下载量 49 浏览量 更新于2024-07-11 收藏 690KB PPT 举报
本课件主要介绍如何在SPSS软件中进行判别分析(Discriminant Analysis)。首先,你需要打开名为"disc.sav"的数据文件,该文件包含一组企业的指标数据,如企业规模、服务、工资比例等,以及已知的三个类别(上升、稳定和下降)。这些指标作为预测变量(predictor variables),而类别变量(group)则是已知的训练样本。 在SPSS中进行判别分析的步骤如下: 1. **打开和加载数据**: - 打开Analyze > Classify > Discriminant,导入disc.sav数据集。 2. **设置变量**: - 将group变量放入Grouping Variable,指定范围,如1-3。 - 如果希望进行逐步判别,不选择"Enter independents together",而是选择"Use stepwise method",以便自动选择最佳变量组合。 3. **选择方法**: - 在Method部分,选择检验变量的方法,如默认的Wilks' Lambda,它评估每个变量对模型解释变量差异的贡献。 4. **输出结果**: - 在Statistics中,勾选Function Coefficient,选择Fisher和Unstandardized,以便获得分类函数的系数。 - 在Matrices中,选择所需的结果矩阵,例如相关阵,用于理解变量之间的关系。 5. **显示输出**: - 在Classify选项中,可以选择Display,例如summary table,显示分类汇总表,以及Leave-one-out classification,即留一法,评估模型的预测性能。 - Prior Probability部分,可以选择All groups equal(所有类别平等对待)或Compute from group sizes(根据类别大小加权),以调整分类时的先验概率。 6. **图形展示**: - 在Plots选项中,可以选择Combined-groups或Territorial map等图表类型,以可视化分类结果。 判别分析与聚类分析的区别在于,聚类分析是无监督学习,没有预先设定的类别,而判别分析则基于已知类别的训练样本,通过构建判别函数来对未知类别进行预测。在判别分析中,目标是找到一个最优的分类标准,以便准确地将未知企业的状况归入预设的类别。 课程还讨论了基于距离判别的概念,例如使用Mahalanobis距离,这是一种考虑变量之间协方差的标准化距离,用于测量样本点与类别中心之间的关系。判别函数(discriminant function)就是根据这些距离来确定新观测值的类别归属。 这节课的重点在于实际操作SPSS进行判别分析,包括数据预处理、模型设置、结果解读和图形展示,以帮助企业根据其指标进行有效的分类决策。