用R语言计算数据框中三个给定指标数据的样本均值,样本离差阵,样本协方差阵,样本相关阵,示例代码
时间: 2024-10-11 17:09:14 浏览: 45
在R语言中,你可以使用`mean()`计算均值,`sd()`计算标准差(离差),`cov()`计算协方差,以及`cor()`计算相关系数来分析数据框中的多变量数据。以下是一个示例代码,假设我们有一个名为df的数据框,其中包含三个列A、B和C:
```r
# 假设 df 是你的数据框,包含列 A, B 和 C
# 计算每个列的样本均值
mean_vec <- apply(df, 2, mean)
cat("Mean of each column:\n", mean_vec, "\n")
# 计算样本离差(标准差)
sd_matrix <- sapply(df, sd)
cat("Sample standard deviation matrix:\n", sd_matrix, "\n")
# 计算样本协方差阵
cov_matrix <- cov(df)
cat("Sample covariance matrix:\n", cov_matrix, "\n")
# 计算样本相关阵(相关系数矩阵)
corr_matrix <- cor(df)
cat("Sample correlation matrix:\n", corr_matrix, "\n")
```
在这个代码片段中,`apply(df, 2, mean)`按列应用`mean()`函数,`sapply(df, sd)`按列应用`sd()`函数,`cov(df)`直接计算整个数据框的协方差矩阵,而`cor(df)`则计算它们的相关系数。
注意,`cov()`和`cor()`的结果都是对角元素为1,因为每个变量与其自身的相关系数总是1(绝对正相关)。[^1]
阅读全文