什么是协方差?如何计算协方差?
时间: 2023-12-10 12:35:51 浏览: 81
协方差是用来衡量两个变量之间关系的统计量。如果两个变量的协方差为正,那么它们之间的关系是正相关的;如果协方差为负,则它们之间的关系是负相关的;如果协方差为零,则它们之间没有线性关系。
协方差的计算公式如下:
$$
cov(X,Y)=\frac{\sum_{i=1}^{n}(X_i-\bar{X})(Y_i-\bar{Y})}{n-1}
$$
其中,$X$和$Y$分别表示两个变量,$X_i$和$Y_i$分别表示第$i$个样本点的取值,$\bar{X}$和$\bar{Y}$分别表示$X$和$Y$的均值,$n$表示样本容量。
举个例子,假设有两个变量$X$和$Y$,它们的取值分别为:
$$
X=[1,2,3,4,5], Y=[5,4,3,2,1]
$$
首先,计算$X$和$Y$的均值:
$$
\bar{X}=\frac{1+2+3+4+5}{5}=3, \bar{Y}=\frac{5+4+3+2+1}{5}=3
$$
然后,计算每个样本点与均值的差:
$$
X-\bar{X}=[-2,-1,0,1,2], Y-\bar{Y}=[2,1,0,-1,-2]
$$
接下来,将每个样本点的差相乘,并将结果相加:
$$
\sum_{i=1}^{5}(X_i-\bar{X})(Y_i-\bar{Y})=(-2\times2)+(-1\times1)+(0\times0)+(1\times(-1))+(2\times(-2))=-10
$$
最后,将结果除以样本容量$n-1$,即:
$$
cov(X,Y)=\frac{-10}{5-1}=-2.5
$$
因此,变量$X$和$Y$的协方差为$-2.5$。
阅读全文