自选数据利用R语言完成基本统计分析:描述性统计分析(集中趋势,离散趋势,分布形状)、频数分析(分类变量:一维)列联分析(二维,三维:交叉频数(频率),边缘频数和频率,边缘频率及频数(和))
时间: 2024-01-21 09:05:08 浏览: 100
R语言基本统计分析案例及代码
好的,假设我们有一个名为 `students` 的数据集,其中包含了学生的姓名、年龄、性别、成绩等信息。我们可以使用 R 语言进行基本的统计分析,如下所示:
## 描述性统计分析
### 集中趋势
#### 数值型数据
对于数值型数据,我们可以计算它们的均值、中位数和众数来描述它们的集中趋势。
```R
# 计算年龄的均值、中位数和众数
mean_age <- mean(students$age)
median_age <- median(students$age)
mode_age <- names(sort(-table(students$age)))[1] # 众数
```
#### 分类型数据
对于分类型数据,我们可以计算它们的众数来描述它们的集中趋势。
```R
# 计算性别的众数
mode_gender <- names(sort(-table(students$gender)))[1] # 众数
```
### 离散趋势
#### 数值型数据
对于数值型数据,我们可以计算它们的方差、标准差、极差和四分位数来描述它们的离散趋势。
```R
# 计算成绩的方差、标准差和极差
var_score <- var(students$score)
sd_score <- sd(students$score)
range_score <- max(students$score) - min(students$score)
# 计算成绩的四分位数
quantile_score <- quantile(students$score, probs = c(0.25, 0.5, 0.75))
```
#### 分类型数据
对于分类型数据,我们可以计算它们的频数和频率来描述它们的离散趋势。
```R
# 计算性别的频数和频率
freq_gender <- table(students$gender)
prop_gender <- prop.table(freq_gender)
```
### 分布形状
#### 数值型数据
对于数值型数据,我们可以绘制它们的直方图、密度图和箱线图来描述它们的分布形状。
```R
# 绘制成绩的直方图
hist(students$score)
# 绘制成绩的密度图
plot(density(students$score))
# 绘制成绩的箱线图
boxplot(students$score)
```
## 频数分析
### 分类变量:一维
对于分类变量,我们可以使用表格和条形图来进行频数分析。
```R
# 绘制性别的频数表和条形图
freq_gender <- table(students$gender)
barplot(freq_gender, main = "Gender Frequency")
```
## 列联分析
### 二维
对于两个分类变量,我们可以使用列联表和堆积条形图来进行列联分析。
```R
# 绘制性别和成绩的列联表和堆积条形图
ctab_gender_score <- table(students$gender, students$score >= 60)
barplot(ctab_gender_score, beside = TRUE, legend = TRUE, args.legend = list(x = "topright"))
```
### 三维
对于三个分类变量,我们可以使用三维列联表和堆积条形图来进行列联分析。
```R
# 绘制性别、年龄和成绩的三维列联表和堆积条形图
ctab_gender_age_score <- table(students$gender, students$age, students$score >= 60)
barplot(ctab_gender_age_score, beside = TRUE, legend = TRUE, args.legend = list(x = "topright"), col = c("red", "green"))
```
阅读全文