SAS多元统计分析:主成分分析与回归
需积分: 40 104 浏览量
更新于2024-07-07
收藏 10.84MB PDF 举报
"SAS初学者多元统计学习资料,包含主成分分析、主成分回归、因子分析、判别分析、聚类分析、典型相关、对应分析等案例,其中重点讲解了主成分分析的步骤和应用。"
在多元统计分析中,主成分分析(Principal Component Analysis, PCA)是一种常用的数据降维技术,它通过线性变换将原始高维数据转换为一组新的正交变量——主成分,这些主成分是原始变量的线性组合,且它们之间的相关性为零。主成分分析的主要目标是尽可能保留原始数据中的变异信息,同时减少数据的复杂性。
在SAS中,执行主成分分析的步骤如下:
1. **选择分析类型**:首先需要确定是使用R型分析(不需标准化)还是S型分析(数据需标准化)。这取决于研究目的和数据特性。
2. **确定主成分个数**:通过计算主成分的方差贡献率来决定保留多少个主成分。通常,保留那些累计贡献率达到80%至85%的主成分。
3. **获取主成分表达式**:查看特征向量(主成分矩阵),可以得到主成分与原始变量之间的线性关系。
4. **计算主成分得分**:利用得到的主成分表达式,计算每个样本在各个主成分上的得分。
5. **样本分析**:通过图解主成分得分,可以了解样本在不同主成分上的分布,进行分类或聚类。
6. **变量分析**:图解变量与主成分的关系,评估主成分分析的效果,观察哪些变量与主成分关联密切。
7. **主成分回归**:使用主成分得分对因变量进行回归分析,建立新的回归模型。
8. **回归模型解释**:将主成分表达式代入回归方程,得到基于原始变量的回归模型,并分析各变量的重要性。
9. **综合评价**:关注主成分1的得分,以及其表达式中哪些指标系数最大,以理解主要影响因素。
在案例分析中,针对区域经济发展的综合分析:
- 使用`PROC PRINCOMP`过程进行主成分分析,可以设置参数`economicout`来保存结果。
- 方法1保留所有主成分,或者方法2指定保留的主成分个数,如保留3个主成分。
- `plot=pattern(ncomp=2)`用于图解变量之间的关系,而`plot=score(ncomp=2)`则用于图解样本在主成分上的分布。
- 分析主成分1和2的累计贡献率,如果达到84.38%,则认为这两个主成分足以解释大部分数据变异。
- 观察主成分表达式,发现主成分1与所有变量正相关,而主成分2与部分变量负相关。
- 输出`PROC PRINT`查看主成分得分,进一步分析主成分1对各项指标的影响。
通过以上步骤,SAS可以帮助研究人员理解和简化数据结构,为后续的建模和决策提供依据。在实际应用中,主成分分析常用于数据分析、特征选择、数据可视化等多个领域。
2021-12-02 上传
2022-03-12 上传
m0_60841773
- 粉丝: 1
- 资源: 1
最新资源
- Raspberry Pi OpenCL驱动程序安装与QEMU仿真指南
- Apache RocketMQ Go客户端:全面支持与消息处理功能
- WStage平台:无线传感器网络阶段数据交互技术
- 基于Java SpringBoot和微信小程序的ssm智能仓储系统开发
- CorrectMe项目:自动更正与建议API的开发与应用
- IdeaBiz请求处理程序JAVA:自动化API调用与令牌管理
- 墨西哥面包店研讨会:介绍关键业绩指标(KPI)与评估标准
- 2014年Android音乐播放器源码学习分享
- CleverRecyclerView扩展库:滑动效果与特性增强
- 利用Python和SURF特征识别斑点猫图像
- Wurpr开源PHP MySQL包装器:安全易用且高效
- Scratch少儿编程:Kanon妹系闹钟音效素材包
- 食品分享社交应用的开发教程与功能介绍
- Cookies by lfj.io: 浏览数据智能管理与同步工具
- 掌握SSH框架与SpringMVC Hibernate集成教程
- C语言实现FFT算法及互相关性能优化指南