层次聚类与K-M聚类实例:SPSS商场分组

需积分: 0 0 下载量 161 浏览量 更新于2024-08-05 收藏 1MB PDF 举报
在本次聚类分析实验中,主要讨论了两种常见的聚类方法:层次聚类和K-Means聚类。首先,我们来看层次聚类部分。 层次聚类是通过逐步合并最相似的观测对象形成类别的方法。在SPSS中,操作步骤如下: 1. 从【分析】>【分类】>选择【系统聚类】,如图1.1所示。 2. 将购货环境和服务质量作为变量,商店变化作为个案标注,如图1.2中的层次分析窗口。 3. 设置统计选项,比如指定类数,此处尝试了2类和3类,如图1.3的解的范围设置。 4. 选择基础的欧式距离作为距离度量方法,如图1.4所示。 5. 分析结果显示在凝聚状态表(表1.1)中,记录了每一步聚类的过程,包括聚类的顺序、合并的观测或小类、距离以及后续聚类的使用情况。例如,4号和5号观测在第1步合并,C商厦在第3步与第1步生成的小类合并。 6. 冰柱图(图1.5)直观展示了聚类结果,通过图形观察聚类的类别关系。 层次聚类的特点是能生成任意类数的分类结果,但需要逐级合并,直到所有样本形成一个大类,且每一步聚类都会对后续步骤产生影响。 接下来是K-Means聚类,它是一种基于划分的聚类方法: 1. 从【分析】>【分类】>选择【K均值聚类】,如图2.1所示。 2. 在K-Means中,省事变量通常作为个案标注依据,其他变量作为数据输入,如图2.2的K-M聚类分析窗口。 3. 这种方法通过迭代计算来确定每个观测点应属于哪个类,每次迭代会重新分配样本到最近的类中心,直到类中心不再改变或达到预设的最大迭代次数,如图2.3的迭代窗口。 4. K-Means的结果通常以类别中心和每个观测点的归属类标签的形式呈现,不同于层次聚类的明确步骤记录。 总结来说,这两种聚类方法在SPSS中各有特点:层次聚类注重逐步合并过程和类别的层级结构,而K-Means则侧重于快速划分和寻找最优的类别中心。理解并灵活运用这些聚类方法有助于对数据进行有效的分类和分析。