r语言iris数据集分析
时间: 2023-09-06 15:14:37 浏览: 82
好的,关于iris数据集的分析,我可以为您介绍一些基本步骤:
1. 载入iris数据集
您可以使用以下代码载入iris数据集:
```r
data(iris)
```
2. 数据探索
您可以使用以下函数对数据集进行探索:
```r
head(iris) # 查看前几行数据
summary(iris) # 描述性统计
str(iris) # 查看数据框的结构
```
3. 数据可视化
数据可视化可以帮助您更好地理解数据集,以下是一些常用的可视化函数:
```r
library(ggplot2) # 载入ggplot2包
ggplot(iris, aes(x=Sepal.Length, y=Sepal.Width, color=Species)) +
geom_point() # 散点图
ggplot(iris, aes(x=Species, y=Sepal.Length)) +
geom_boxplot() # 箱线图
```
4. 建立模型
您可以使用以下代码建立预测模型:
```r
# 将数据集分为训练集和测试集
set.seed(1234)
trainIndex <- sample(1:nrow(iris), round(0.7 * nrow(iris)))
trainData <- iris[trainIndex, ]
testData <- iris[-trainIndex, ]
# 建立决策树模型
library(rpart)
model <- rpart(Species ~ ., data=trainData, method="class")
```
5. 模型评估
您可以使用以下代码对模型进行评估:
```r
# 预测测试集
predictions <- predict(model, testData, type="class")
# 计算准确率
mean(predictions == testData$Species)
```
以上是一些基本的分析步骤,您可以根据具体需求进行相应的调整和扩展。