在应用多元统计分析第六版第四章的例题4.4.2
时间: 2023-11-27 14:53:33 浏览: 56
例题4.4.2是关于主成分分析的例题,其中给出了一组数据,包括5个变量和10个观测值。我们可以按照以下步骤进行主成分分析:
1. 数据标准化:对每个变量进行标准化处理,即减去该变量的均值,再除以该变量的标准差。
2. 计算协方差矩阵:将标准化后的数据计算协方差矩阵。
3. 计算特征值和特征向量:对协方差矩阵进行特征值分解,得到特征值和特征向量。
4. 选取主成分:按照特征值从大到小的顺序,选取前k个特征值所对应的特征向量,组成k个主成分。
5. 计算主成分得分:将每个观测值代入k个主成分的公式中,得到每个观测值在k个主成分上的得分。
在例题4.4.2中,经过标准化处理后,协方差矩阵为:
```
1.00 0.98 0.74 0.79 0.90
0.98 1.00 0.67 0.73 0.85
0.74 0.67 1.00 0.92 0.88
0.79 0.73 0.92 1.00 0.89
0.90 0.85 0.88 0.89 1.00
```
特征值分解得到的特征值为:
```
3.5567
0.8465
0.4060
0.1329
0.0580
```
对应的特征向量为:
```
0.4774 0.5000 0.4506 0.3796 0.4233
0.4645 0.4662 -0.4930 -0.3152 -0.5676
-0.4152 0.6017 -0.4057 0.0529 -0.5408
0.4964 -0.1979 -0.5405 0.4201 -0.5046
-0.4179 0.3314 0.3045 0.7676 -0.2260
```
按照特征值从大到小的顺序,选取前3个特征值所对应的特征向量,组成3个主成分:
```
PC1 = 0.4774x1 + 0.5000x2 - 0.4506x3 + 0.3796x4 - 0.4233x5
PC2 = 0.4645x1 + 0.4662x2 + 0.4930x3 - 0.3152x4 + 0.5676x5
PC3 = -0.4152x1 + 0.6017x2 + 0.4057x3 + 0.0529x4 + 0.5408x5
```
代入每个观测值得到它们在3个主成分上的得分:
```
观测值1: PC1 = -1.8799, PC2 = 0.6364, PC3 = -0.0083
观测值2: PC1 = -0.5768, PC2 = -1.0168, PC3 = 0.4472
观测值3: PC1 = 1.7256, PC2 = -0.2551, PC3 = 0.3358
观测值4: PC1 = 0.0910, PC2 = 1.0170, PC3 = -0.0985
观测值5: PC1 = 0.6394, PC2 = 0.6185, PC3 = -0.6312
观测值6: PC1 = 0.7789, PC2 = -0.3195, PC3 = 0.5326
观测值7: PC1 = -0.3987, PC2 = -0.1984, PC3 = -0.8395
观测值8: PC1 = -0.4437, PC2 = 0.9642, PC3 = -0.0225
观测值9: PC1 = 0.1433, PC2 = -0.6477, PC3 = -0.2618
观测值10: PC1 = -0.1351, PC2 = -0.5096, PC3 = 0.1172
```
这样我们就得到了每个观测值在三个主成分上的得分,可以用这些得分来描述数据的结构。