R语言数据分析案例
时间: 2023-07-10 16:09:33 浏览: 74
以下是一个简单的R语言数据分析案例,展示如何使用R进行数据清洗、可视化和建模。
假设我们有一个包含房价和相关变量的数据集,我们想要预测房价。首先,我们可以使用以下代码读取数据集:
```R
data <- read.csv("house_price.csv")
```
接下来,我们可以使用以下代码来清洗数据集:
```R
# 删除缺失值
data <- na.omit(data)
# 删除无用的变量
data <- subset(data, select = -c(var1, var2))
# 转换数据类型
data$price <- as.numeric(data$price)
data$area <- as.numeric(data$area)
data$rooms <- as.factor(data$rooms)
```
然后,我们可以使用以下代码来可视化数据集:
```R
# 绘制散点图
plot(data$area, data$price)
# 绘制箱线图
boxplot(data$price ~ data$rooms)
```
最后,我们可以使用以下代码来建立模型:
```R
# 拆分数据集
library(caret)
set.seed(123)
trainIndex <- createDataPartition(data$price, p = .8, list = FALSE)
trainData <- data[trainIndex, ]
testData <- data[-trainIndex, ]
# 建立线性回归模型
library(glmnet)
model <- glmnet(price ~ ., data = trainData, alpha = 0.5)
# 预测测试集结果
predictions <- predict(model, testData)
```
这是一个简单的R语言数据分析案例,展示了如何使用R进行数据清洗、可视化和建模。