r语言对鸢尾花数据iris做决策树分类、打印结果,并用rpart.plot()函数绘制的决策树。
时间: 2024-12-11 09:23:57 浏览: 15
在R语言中,我们可以使用`caret`或`rpart`包来进行决策树分类。以`iris`数据集为例,它是R内置的数据集,包含了鸢尾花的测量值及其物种标签。下面是使用`rpart`包创建决策树并绘制的过程:
首先,确保已安装`rpart`和`rpart.plot`包,如果尚未安装,可以使用以下命令:
```R
install.packages("rpart")
install.packages("rpart.plot")
```
接下来,加载必要的库:
```R
library(rpart)
library(rpart.plot)
```
然后,我们将数据集分为训练集和测试集:
```R
data(iris)
set.seed(123) # 设置随机种子以便于复现结果
trainIndex <- sample(1:nrow(iris), nrow(iris) * 0.7) # 70%用于训练
trainData <- iris[trainIndex, ]
testData <- iris[-trainIndex, ]
```
接着,我们使用`rpart()`函数构建决策树模型:
```R
treeModel <- rpart(Species ~ ., data = trainData, method = "class")
```
这里,`Species`是我们要预测的目标变量,`.`代表所有其他特征。
最后,我们画出决策树:
```R
# 使用rpart.plot()函数绘制
prp(treeModel, type = 3, main = "Iris Decision Tree", sub = "Training Data")
```
`type = 3`表示生成完整的树,`main`和`sub`分别设置主标题和副标题。
完成以上步骤后,你应该能看到决策树的可视化图以及一些分类信息。你可以通过查看训练集的表现(如混淆矩阵等)来评估模型的性能。
阅读全文