SAS系统中费氏紫罗兰数据分析:相斥式集群与统计程序应用
需积分: 49 128 浏览量
更新于2024-08-10
收藏 4.88MB PDF 举报
"费氏紫罗兰的相斥式集群分析-190422-st_tech_trends_report_2020-2040"
这篇报告主要涉及了使用SAS软件进行的一种聚类分析——费氏紫罗兰数据集的相斥式集群分析。费氏紫罗兰数据集是统计学中的一个经典示例,包含不同种类紫罗兰的花萼长度(SEPALLEN)、花萼宽度(SEPALWID)、花瓣长度(PETALLEN)和花瓣宽度(PETALWID)四个特征。报告中使用的FASTCLUS(快速聚类)程序是一种迭代方法,旨在将数据分成多个类别,使得类别内的相似度最大化,类别间的差异最大化。
在本次分析中,FASTCLUS设置了Replace=FULL(表示完全替换模式),Radius=0(没有指定半径限制),Maxclusters=2(最多分为2个类别),Maxiter=10(最大迭代次数为10次),Converge=0.02(收敛标准为0.02)。初始种子的选择是基于数据点的,最小距离为70.85196。分析结果满足了收敛条件,最终的聚类准则基于最终种子为5.0417。
聚类结果展示为两个类别(Cluster 1和Cluster 2),每个类别的频率、标准偏差(RMS Std)以及从种子到观察值的最大距离被列出。Cluster 1有53个样本,标准偏差为3.7050,最大距离为21.1621;Cluster 2有97个样本,标准偏差为5.6779,最大距离为24.6430。同时,报告还提供了最近邻的距离,表明两个类别的最近邻距离相同,都是39.2879。
报告还给出了变量的统计信息,包括总标准差(Total STD)、内部标准差(Within STD)、决定系数(R-Squared)以及调整决定系数(RSQ/(1-RSQ))。这四个特征的R-Squared值均较高,说明聚类效果较好,其中PETALLEN和PETALWID的决定系数超过0.7,表明这两个特征对区分类别有较大影响。
此外,报告提到了SAS系统内七种常用的描述性统计程序,如PROCMEANS、PROCSUMMARY、PROCUNIVARIATE等,这些程序分别用于生成不同类型的统计输出,如均值、标准差、直方图等。它们在统计分析中扮演着重要角色,帮助用户更好地理解和解释数据。而本报告中的FASTCLUS是这些工具之一,专门用于处理聚类问题,通过分析数据的内在结构来发现潜在的群组。
点击了解资源详情
点击了解资源详情
点击了解资源详情
186 浏览量
2015-01-10 上传
2024-04-24 上传
2010-05-20 上传
299 浏览量

史东来
- 粉丝: 44
最新资源
- VB通过Modbus协议控制三菱PLC通讯实操指南
- simfinapi:R语言中简化SimFin数据获取与分析的包
- LabVIEW温度控制上位机程序开发指南
- 西门子工业网络通信实例解析与CP243-1应用
- 清华紫光全能王V9.1软件深度体验与功能解析
- VB实现Access数据库数据同步操作指南
- VB实现MSChart绘制实时监控曲线
- VC6.0通过实例深入访问Excel文件技巧
- 自动机可视化工具:编程语言与正则表达式的图形化解释
- 赛义德·莫比尼:揭秘其开创性技术成果
- 微信小程序开发教程:如何实现模仿ofo共享单车应用
- TrueTable在Windows10 64位及CAD2007中的完美适配
- 图解Win7搭建IIS7+PHP+MySQL+phpMyAdmin教程
- C#与LabVIEW联合采集NI设备的电压电流信号并创建Excel文件
- LP1800-3最小系统官方资料压缩包
- Linksys WUSB54GG无线网卡驱动程序下载指南