自选数据利用R语言完成基本统计分析:描述性统计分析(集中趋势,离散趋势,分布形状)、频数分析(分类变量:一维)列联分析(二维,三维:交叉频数(频率),边缘频数和频率,边缘频率及频数(和))、相关性分析(协方差、相关系数(两个变量,多个变量)及检验(两个变量,多个变量))、独立性检验(卡方检验,Fisher检验)t检验(独立样本、非独立样本)等。
时间: 2024-01-21 13:02:39 浏览: 66
统计分析R语言
4星 · 用户满意度95%
好的,以下是一些示例代码,来演示如何在R中对数据进行基本统计分析:
1. 描述性统计分析
- 集中趋势:
```
# 生成一个随机向量
x <- rnorm(100)
# 计算均值、中位数和众数
mean(x)
median(x)
library(modeest)
mlv(x)
```
- 离散趋势:
```
# 计算标准差、方差和四分位差
sd(x)
var(x)
IQR(x)
```
- 分布形状:
```
# 计算偏度和峰度
library(moments)
skewness(x)
kurtosis(x)
```
2. 频数分析
```
# 生成一个随机向量
x <- sample(1:5, 100, replace = TRUE)
# 计算频数和频率
table(x)
prop.table(table(x))
```
3. 列联分析
- 二维列联表:
```
# 生成两个随机向量
x <- sample(letters[1:2], 100, replace = TRUE)
y <- sample(LETTERS[1:2], 100, replace = TRUE)
# 构建二维列联表
table(x, y)
# 计算边缘频数和频率
margin.table(table(x, y))
prop.table(table(x, y))
```
- 三维列联表:
```
# 生成三个随机向量
x <- sample(letters[1:2], 100, replace = TRUE)
y <- sample(LETTERS[1:2], 100, replace = TRUE)
z <- sample(1:2, 100, replace = TRUE)
# 构建三维列联表
table(x, y, z)
# 计算边缘频数和频率
margin.table(table(x, y, z))
prop.table(table(x, y, z))
```
4. 相关性分析
- 协方差和相关系数:
```
# 生成两个随机向量
x <- rnorm(100)
y <- rnorm(100)
# 计算协方差和相关系数
cov(x, y)
cor(x, y)
```
- 多个变量的相关性分析:
```
# 生成三个随机向量
x <- rnorm(100)
y <- rnorm(100)
z <- rnorm(100)
# 计算相关系数矩阵
cor(cbind(x, y, z))
```
- 相关系数的显著性检验:
```
# 生成两个随机向量
x <- rnorm(100)
y <- rnorm(100)
# 计算相关系数及其显著性
cor.test(x, y)
```
5. 独立性检验
- 卡方检验:
```
# 生成一个随机矩阵
x <- matrix(sample(1:10, 20, replace = TRUE), nrow = 4)
# 进行卡方检验
chisq.test(x)
```
- Fisher检验:
```
# 生成一个随机矩阵
x <- matrix(sample(1:10, 20, replace = TRUE), nrow = 4)
# 进行Fisher检验
fisher.test(x)
```
6. t检验
- 独立样本t检验:
```
# 生成两个随机向量
x <- rnorm(100)
y <- rnorm(100)
# 进行独立样本t检验
t.test(x, y)
```
- 非独立样本t检验:
```
# 生成两个随机向量
x <- rnorm(100)
y <- x + rnorm(100, sd = 0.5)
# 进行非独立样本t检验
t.test(x, y, paired = TRUE)
```
阅读全文