Error in xgb.DMatrix(data = as.matrix(train[, -c(1, 2)]), label = train$U) : 'data' has class 'character' and length 4510. 'data' accepts either a numeric matrix or a single filename.

这个错误的原因是你传递给 `xgb.DMatrix` 函数的数据类型不正确。你需要将数据转换为数值型矩阵，或者将数据保存在文件中并传递文件名。如果你的数据包含字符型变量，需要将其转换为数值型变量。你可以使用 `as.numeric()` 函数将其转换为数值型变量，或者使用 `factor()` 函数将其转换为因子型变量。例如，假设你的数据集中包含一个字符型变量 `var1`，你可以使用以下代码将其转换为数值型变量： ``` train$var1 <- as.numeric(train$var1) ``` 或者使用以下代码将其转换为因子型变量： ``` train$var1 <- factor(train$var1) ``` 另外，如果你的数据集较大，可以将其保存在文件中并传递文件名。例如： ``` write.csv(train, "train.csv", row.names = FALSE) dtrain <- xgb.DMatrix("train.csv") ``` 这样可以避免将整个数据集保存在内存中，减少内存消耗。

We have seen the cars2018.csv data in the 'Example: Fuel Consumption' Lecture Task 1: Install {keras} (and Tenserflow) on your computer. Make sure its linkage with Python libary is also established. (It is one of the key steps for this assignment. It may take some time if you have not get the right library installed. Here is a reference link. https://keras.rstudio.com/reference/install_keras.html) Task 2: Divide the data randomly into 80% training and 20% test, fit a neural network model on fuel consumption (mpg) with one hidden dense layer. Choose the number of hidden units, and select the right activation function and modelling parameters. Task 3: Fit another neural network with 2 hidden dense layers, i.e. stack another hidden layer on top of the pervious neural net. Choose the number of the hidden units for the second layer. Compare the results with output from Task 2. Task 4: Compare the model performance with the model discussed in the lecture, i.e. the lasso, rpart, random forest, and xgboost models. Task 5: Change the response variable from mpg to Liters/KM (i.e. 235.15/mpg), and re-fit a neural network model. Compare performance as in Task 4.请你提供这个题目的task4的代码

好的，以下是Task 4的代码，包括了Lasso、rpart、随机森林和xgboost模型的训练和评估： ```R library(caret) library(mlbench) library(glmnet) library(rpart) library(randomForest) library(xgboost) # Load data data("cars2018") # Task 2 - Fit a neural network model with one hidden layer set.seed(123) train_index <- createDataPartition(cars2018$mpg, p = 0.8, list = FALSE) train_data <- cars2018[train_index, ] test_data <- cars2018[-train_index, ] model1 <- keras_model_sequential() %>% layer_dense(units = 10, activation = "relu", input_shape = ncol(train_data) - 1) %>% layer_dense(units = 1) compile(model1, optimizer = "adam", loss = "mean_squared_error", metrics = "mean_squared_error") history1 <- fit(model1, as.matrix(train_data[, -1]), train_data$mpg, epochs = 50, batch_size = 32, validation_split = 0.2, verbose = 0) plot(history1) # Task 3 - Fit a neural network model with two hidden layers model2 <- keras_model_sequential() %>% layer_dense(units = 10, activation = "relu", input_shape = ncol(train_data) - 1) %>% layer_dense(units = 5, activation = "relu") %>% layer_dense(units = 1) compile(model2, optimizer = "adam", loss = "mean_squared_error", metrics = "mean_squared_error") history2 <- fit(model2, as.matrix(train_data[, -1]), train_data$mpg, epochs = 50, batch_size = 32, validation_split = 0.2, verbose = 0) plot(history2) # Task 4 - Compare the model performance with other models # Lasso model set.seed(123) train_index <- createDataPartition(cars2018$mpg, p = 0.8, list = FALSE) train_data <- cars2018[train_index, ] test_data <- cars2018[-train_index, ] glmnet_fit <- cv.glmnet(as.matrix(train_data[, -1]), train_data$mpg, alpha = 1, nfolds = 10) lasso_pred <- predict(glmnet_fit, newx = as.matrix(test_data[, -1]), s = "lambda.min") lasso_mse <- mean((lasso_pred - test_data$mpg) ^ 2) lasso_mae <- mean(abs(lasso_pred - test_data$mpg)) # rpart model set.seed(123) train_index <- createDataPartition(cars2018$mpg, p = 0.8, list = FALSE) train_data <- cars2018[train_index, ] test_data <- cars2018[-train_index, ] rpart_fit <- rpart(mpg ~ ., data = train_data, method = "anova") rpart_pred <- predict(rpart_fit, newdata = test_data) rpart_mse <- mean((rpart_pred - test_data$mpg) ^ 2) rpart_mae <- mean(abs(rpart_pred - test_data$mpg)) # Random forest model set.seed(123) train_index <- createDataPartition(cars2018$mpg, p = 0.8, list = FALSE) train_data <- cars2018[train_index, ] test_data <- cars2018[-train_index, ] rf_fit <- randomForest(mpg ~ ., data = train_data, ntree = 500) rf_pred <- predict(rf_fit, newdata = test_data) rf_mse <- mean((rf_pred - test_data$mpg) ^ 2) rf_mae <- mean(abs(rf_pred - test_data$mpg)) # XGBoost model set.seed(123) train_index <- createDataPartition(cars2018$mpg, p = 0.8, list = FALSE) train_data <- cars2018[train_index, ] test_data <- cars2018[-train_index, ] xgb_train <- xgb.DMatrix(data = as.matrix(train_data[, -1]), label = train_data$mpg) xgb_test <- xgb.DMatrix(data = as.matrix(test_data[, -1]), label = test_data$mpg) xgb_params <- list(objective = "reg:squarederror", max_depth = 3, eta = 0.1, subsample = 0.5, colsample_bytree = 0.5) xgb_fit <- xgb.train(params = xgb_params, data = xgb_train, nrounds = 100) xgb_pred <- predict(xgb_fit, newdata = xgb_test) xgb_mse <- mean((xgb_pred - test_data$mpg) ^ 2) xgb_mae <- mean(abs(xgb_pred - test_data$mpg)) # Compare model performance model_mse <- c(lasso_mse, rpart_mse, rf_mse, xgb_mse) model_mae <- c(lasso_mae, rpart_mae, rf_mae, xgb_mae) model_perf <- data.frame(Model = c("Lasso", "rpart", "Random Forest", "XGBoost"), MSE = model_mse, MAE = model_mae) print(model_perf) ``` 以上是Task 4的代码，包括了Lasso、rpart、随机森林和xgboost模型的训练和评估，希望可以帮到你！

阅读全文

Error in xgb.DMatrix(data = as.matrix(train[, -c(1, 2)]), label = train$U) : 'data' has class 'character' and length 4510. 'data' accepts either a numeric matrix or a single filename.

相关推荐

人工智能与内容安全风控-4-2 纵向联邦 XGB 算法.zip

200w数据分类-高质量精讲.rar

LS产电XGB-U型样本.zip

utlog.sqlite

钢结构原理课程设计：露顶式平面钢闸门设计任务及指南

springboot-vue-数计学院学生综合素质评价系统的设计与实现-源码工程-29页从零开始全套图文详解-28页设计论文-21页答辩ppt-全套开发环境工具、文档模板、电子教程、视频教学资源分享

四相交错并联同步整流Buck变器 MATLAB仿真 低压大电流 输入：12VDC 输出：1V 100A 单相电流25A 关键参数设计，磁元件设计 理想仿真，实现均流输出

Python机器人-这是机器人算法的 Python 代码集合

mellitz_3dj_01_2411.zip

Shell编程范例完整版PDF最新版本

MMC-HVDC仿真模型，pscad柔性直流输电仿真mmc仿真模型，双端mmc模型，MMC为21电平NLM和均压控制，还有多端如张北直流电网以及基本mmc逆变器，自己为biye网上收集的一些觉得有用的

MATLAB金属表面缺陷分析（面板）.rar

python项目实战之旅游推荐数据分析可视化(源码+部署说明).zip

西门子1200与ABB机器人TCP 通信案例.zip

森林草原防灭火指挥系统解决方案（和对讲）PPT(44页).pptx

Java源码ssm框架社区生活超市进销存购物商城管理-毕业设计论文-期末大作业.rar

基于springboot的师生共评的作业管理系统设计与实现源码（java毕业设计完整源码+LW）.zip

口腔诊所系统-JAVA-基于SpringBoot的口腔诊所系统的设计与实现

机械设计互感器电流测试台（sw21可编辑+工程图）全套设计资料100%好用.zip

大家在看

一种基于SLA的业务管理模型

蓝矩智慧校友管理系统

ThinkPadT61升级BIOS2.29程序，升级后可支持8GB内存，SATAIII固态盘，支持T9300CPU

saml-idp.zip

思科无线接入点无法连接到无线 LAN 控制器

最新推荐

易语言例程：用易核心支持库打造功能丰富的IE浏览框

管理建模和仿真的文件

STM32F407ZG引脚功能深度剖析：掌握引脚分布与配置的秘密（全面解读）

给出文档中问题的答案代码

Docker构建与运行Next.js应用的指南

"互动学习：行动中的多样性与论文攻读经历"

【热传递模型的终极指南】：掌握分类、仿真设计、优化与故障诊断的18大秘诀

python经典题型和解题代码

宠物控制台应用程序：Java编程实践与反思

关系数据表示学习

四相交错并联同步整流Buck变器 MATLAB仿真低压大电流输入：12VDC 输出：1V 100A 单相电流25A 关键参数设计，磁元件设计理想仿真，实现均流输出