使用 UCI Machine Learning Repository 的液体超声波流量计（liquid ultrasonic flowneter）数据Meter_D（见附件），进行多分类问题的 SVM 估计。其中，第 44 个变量为输出变量，表示流量计的四种不同状态（1 为Health，2 为Gas injection，3 为Installation effects，4为 Waxing）。前 43 个变量为流量计的一系列度量指标，均为数值型输入变量。研究目的是根据这些指标判断流量计的质量状况。请根据下述题目要求，在附件R代码的基础上进行补充，并回答相关问题。 ● 将数据文件置于当前工作目录，使用命令read.csv(file = "Meter_D.csv", header = TRUE, sep = ",") 读入数据，并将第44个变量设为因子。 ● 使用set.seed(1)，采用无放回抽样随机选取100个观测作为训练集，其余作为测试集。 (4) 单选题对标准化后的数据，采用10折交叉验证，选择线性核的最优损失惩罚超参数C（取值为0.001, 0.01, 0.1, 1, 5, 10, 100, 1000），并计算最优模型的训练误差。最优损失惩罚超参数C为（），最优模型的训练误差为（） A 100 1% B 1 4% C 100 3% D 5 2%

时间: 2024-03-05 09:53:54 浏览: 23

根据题意，我们可以进行以下步骤： 1. 读入数据文件并将第44个变量设为因子： ``` data <- read.csv(file = "Meter_D.csv", header = TRUE, sep = ",") data[,44] <- as.factor(data[,44]) ``` 2. 采用无放回抽样随机选取100个观测作为训练集，其余作为测试集： ``` set.seed(1) train_index <- sample(1:nrow(data), 100, replace = FALSE) train_data <- data[train_index, ] test_data <- data[-train_index, ] ``` 3. 进行数据标准化： ``` train_x <- scale(train_data[, 1:43]) train_y <- train_data[, 44] test_x <- scale(test_data[, 1:43]) test_y <- test_data[, 44] ``` 4. 进行10折交叉验证，选择线性核的最优损失惩罚超参数C： ``` library(e1071) tune.out <- tune(svm, train_x, train_y, kernel = "linear", ranges = list(cost = c(0.001, 0.01, 0.1, 1, 5, 10, 100, 1000)), tunecontrol = tune.control(cross = 10)) best_c <- tune.out$best.parameters$cost ``` 5. 计算最优模型的训练误差： ``` svm_model <- svm(train_x, train_y, kernel = "linear", cost = best_c) pred_train <- predict(svm_model, train_x) train_error <- mean(pred_train != train_y) ``` 根据以上步骤，我们可以得到最优损失惩罚超参数C为0.1，最优模型的训练误差为3%，因此答案为C 100 3%。

相关推荐

SRBCT.zip_machine learning_uci数据库 SRBCT_二分类_二分类 python_数据集分类

machineLearning.rar_UCI分类_python垃圾邮件_垃圾分类_垃圾邮件_机器学习uci

SVM.zip_SVM Iris分类_UCI SVM_iris_svm预测_uci svm

编程实现Fisher判据，并从UCI数据库UCI Machine Learning Repository中找两个二类分类数据进行训练和测试。

怎么下载UCI Machine Learning Repository上的DNA序列分类数据集

UCI Machine Learning Repository上的DNA序列分类数据集

使用UCI Machine Learning Repository的蘑菇数据Mushroom.csv进行随机森林的估计，需要注意什么

Python 编程实现Fisher判据，并从UCI数据库UCI Machine Learning Repository中找两个二类分类数据进行训练和测试。

对UCI Machine Learning Repository的混凝土数据使用随机森林的估计

UCI Machine Learning Repository 的糖尿病数据集

ml_homework_1.rar_spambase_svm实现垃圾邮件分类_uci_uci spambase_垃圾邮件

cq_data.rar_UCI 数据集_cqdata_test_爬虫_爬虫分类

mat.rar_UCI 数据_mat数据集_人工智能_分类 数据集_数据集

Absolute-Zero-master.zip_Zero_machine learning_uci引擎

machine-learning-projects:使用知名的UCI数据集上的回归来预测葡萄酒质量

Matlab_SVM.zip_CVX_UCI 数据集_cvx_begin_matlab CVX工具箱_散点图 优化

Dijkstra算法的详细介绍

Matlab通信原理-QPSK数字通信系统的仿真

搜索引擎 PHP源码 免费开源

最新推荐

Dijkstra算法的详细介绍

Matlab通信原理-QPSK数字通信系统的仿真

搜索引擎 PHP源码 免费开源

机器学习作业基于 Python 的历史照片EXIF元数据 GIS机器学习分析源码+项目说明.zip

基于深度学习的线性预测设计工程文件

利用迪杰斯特拉算法的全国交通咨询系统设计与实现

管理建模和仿真的文件

【实战演练】基于TensorFlow的卷积神经网络图像识别项目

CD40110工作原理

全国交通咨询系统C++实现源码解析

mat.rar_UCI 数据_mat数据集_人工智能_分类数据集_数据集

Matlab_SVM.zip_CVX_UCI 数据集_cvx_begin_matlab CVX工具箱_散点图优化

搜索引擎 PHP源码免费开源

搜索引擎 PHP源码免费开源