R语言鸢尾花数据集的 逻辑回归模型
时间: 2024-01-25 13:11:55 浏览: 137
逻辑回归模型是一种用于解决二分类问题的机器学习方法,可以在R语言中使用鸢尾花数据集进行建模和预测。下面是一个示例代码:
```R
# 导入所需的包
library(datasets)
library(caTools)
library(ggplot2)
# 加载鸢尾花数据集
data(iris)
# 将鸢尾花数据集分为训练集和测试集
set.seed(123)
split <- sample.split(iris$Species, SplitRatio = 0.7)
train <- subset(iris, split == TRUE)
test <- subset(iris, split == FALSE)
# 创建逻辑回归模型
model <- glm(Species ~ ., data = train, family = binomial)
# 在测试集上进行预测
predictions <- predict(model, newdata = test, type = "response")
# 将预测结果转换为类别
predicted_classes <- ifelse(predictions > 0.5, "versicolor", "setosa")
# 计算准确率
accuracy <- sum(predicted_classes == test$Species) / nrow(test)
print(paste("Accuracy:", accuracy))
# 绘制预测结果与实际结果的散点图
ggplot(data = test, aes(x = Sepal.Length, y = Sepal.Width, color = Species)) +
geom_point() +
geom_point(data = test, aes(x = Sepal.Length, y = Sepal.Width, color = predicted_classes), shape = 1, size = 3)
```
这段代码首先导入所需的包,然后加载鸢尾花数据集,并将数据集分为训练集和测试集。接下来,使用`glm`函数创建逻辑回归模型,其中`Species ~ .`表示使用所有的特征进行建模,`family = binomial`表示使用二项分布作为模型的假设。然后,在测试集上使用`predict`函数进行预测,并将预测结果转换为类别。最后,计算预测的准确率,并使用`ggplot2`包绘制预测结果与实际结果的散点图。
阅读全文