R语言数据分析案例
时间: 2023-07-10 20:17:04 浏览: 46
以下是一个简单的R语言数据分析案例:
假设我们有一个包含学生数学、语文和英语成绩的数据集,我们想要进行以下分析:
1. 描述性统计分析:计算每个科目的平均分、标准差、最高分、最低分等统计指标。
2. 相关性分析:计算每两个科目之间的相关系数,看看它们之间是否存在相关性。
3. 可视化分析:绘制每个科目的直方图和箱线图,查看数据分布情况;同时绘制散点图,查看每两个科目之间的关系。
下面是实现这些分析的代码:
```R
# 导入数据
data <- read.csv("student_scores.csv")
# 描述性统计分析
math_stats <- c(mean(data$math), sd(data$math), max(data$math), min(data$math))
chinese_stats <- c(mean(data$chinese), sd(data$chinese), max(data$chinese), min(data$chinese))
english_stats <- c(mean(data$english), sd(data$english), max(data$english), min(data$english))
print("Math stats:")
print(math_stats)
print("Chinese stats:")
print(chinese_stats)
print("English stats:")
print(english_stats)
# 相关性分析
correlation <- cor(data[, c("math", "chinese", "english")])
print(correlation)
# 可视化分析
par(mfrow=c(2,2))
hist(data$math, main="Math Scores")
hist(data$chinese, main="Chinese Scores")
hist(data$english, main="English Scores")
boxplot(data[, c("math", "chinese", "english")], main="Boxplot of Scores")
plot(data$math, data$chinese, main="Math vs. Chinese", xlab="Math Scores", ylab="Chinese Scores")
plot(data$math, data$english, main="Math vs. English", xlab="Math Scores", ylab="English Scores")
plot(data$chinese, data$english, main="Chinese vs. English", xlab="Chinese Scores", ylab="English Scores")
```
希望这个例子能帮助你更好地了解如何使用R语言进行数据分析。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![txt](https://img-home.csdnimg.cn/images/20210720083642.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![pptx](https://img-home.csdnimg.cn/images/20210720083543.png)