请给我一个r语言进行数据挖掘的项目代码
时间: 2024-02-17 14:05:22 浏览: 20
好的,以下是一个简单的R语言数据挖掘项目代码示例,供您参考:
```R
# 加载所需的包
library(tidyverse) # 数据处理和可视化
library(caret) # 机器学习建模
# 加载数据集
data("iris")
# 数据预处理
# 将 Species 转换为数值型变量
iris$Species <- as.numeric(factor(iris$Species))
# 划分训练集和测试集
set.seed(123)
train_index <- createDataPartition(iris$Species, p = 0.8, list = FALSE)
train_data <- iris[train_index, ]
test_data <- iris[-train_index, ]
# 特征工程
# 无需进行特征工程,因为数据集中已经没有缺失值和异常值,可以直接进行建模
# 建立模型
# 使用 k-近邻算法进行分类
knn_model <- train(Species ~ ., data = train_data, method = "knn", trControl = trainControl(method = "cv"))
# 模型评估
# 对测试集进行预测
test_pred <- predict(knn_model, newdata = test_data)
# 计算准确率
accuracy <- mean(test_pred == test_data$Species)
print(paste0("Accuracy: ", accuracy))
```
以上代码的数据集为经典的鸢尾花数据集,使用 k-近邻算法进行分类,最终输出测试集的预测准确率。您可以根据自己的需要修改数据集和模型算法。