二维样本协方差矩阵的计算例子
时间: 2023-07-24 16:12:50 浏览: 162
好的,我来给你举个例子。假设我们有以下的二维样本数据集:
```
x1 = [1, 2, 3, 4, 5]
x2 = [3, 5, 7, 9, 11]
```
我们可以将其表示为一个2x5的矩阵:
```
X = [[1, 2, 3, 4, 5],
[3, 5, 7, 9, 11]]
```
接下来,我们需要计算该数据集的协方差矩阵。首先,我们需要计算每个特征(即每列)的均值。均值的计算公式为:
```
mean(x) = sum(x) / n
```
其中,`sum(x)`表示特征x的所有样本值的和,`n`表示样本数量。对于我们的数据集来说,特征x1和x2的均值分别为:
```
mean(x1) = (1 + 2 + 3 + 4 + 5) / 5 = 3
mean(x2) = (3 + 5 + 7 + 9 + 11) / 5 = 7
```
接下来,我们需要计算每个特征与数据集的均值之差。差值的计算公式为:
```
deviation(x) = x - mean(x)
```
对于我们的数据集来说,特征x1和x2的差值分别为:
```
deviation(x1) = [1-3, 2-3, 3-3, 4-3, 5-3] = [-2, -1, 0, 1, 2]
deviation(x2) = [3-7, 5-7, 7-7, 9-7, 11-7] = [-4, -2, 0, 2, 4]
```
接下来,我们可以计算该数据集的协方差矩阵。协方差矩阵的计算公式为:
```
covariance(X) = deviation(X) * deviation(X).T / (n-1)
```
其中,`deviation(X)`表示数据集的每个特征与均值之差的矩阵,`.T`表示矩阵的转置。对于我们的数据集来说,协方差矩阵的计算过程如下:
```
deviation(X) = [[-2, -1, 0, 1, 2],
[-4, -2, 0, 2, 4]]
covariance(X) = deviation(X) * deviation(X).T / (n-1)
= [[10, 20],
[20, 40]] / 4
= [[2.5, 5],
[5, 10]]
```
因此,该数据集的协方差矩阵为:
```
[[2.5, 5],
[5, 10]]
```
阅读全文