上述代码出错了,位置 2 处的索引超出数组边界(不能超出 4)。 出错 Untitled2 (line 8) data = iris(iris(:,5)==i,:); 怎么解决
时间: 2023-09-28 14:05:57 浏览: 108
非常抱歉,我在代码中写错了,应该使用 `iris(:,5)` 而不是 `iris(:,6)`,因为 iris 数据集包含了四个特征和一个标签,标签在第五列。
以下是修改后的代码:
```matlab
iris = load('C:\Users\86187\Desktop\Iris (1).csv'); % 导入鸢尾花数据集
% 将数据集分为训练集和测试集
train_data = []; % 训练集
train_label = []; % 训练集标签
test_data = []; % 测试集
test_label = []; % 测试集标签
for i = 1:3 % 遍历三个类别
data = iris(iris(:,5)==i,:); % 取出当前类别的所有样本
train_data = [train_data; data(1:40,1:4)]; % 取前40个样本作为训练集
train_label = [train_label; repmat(i-1, 40, 1)]; % 对应标签为0、1、2
test_data = [test_data; data(41:50,1:4)]; % 取后10个样本作为测试集
test_label = [test_label; repmat(i-1, 10, 1)]; % 对应标签为0、1、2
end
% 计算每个类别的概率密度函数的均值和方差
mu = zeros(3, 4); % 每个类别的均值
sigma = zeros(3, 4); % 每个类别的方差
for i = 1:3 % 遍历三个类别
data = train_data(train_label == i-1,:); % 取出当前类别的样本
mu(i,:) = mean(data); % 计算均值
sigma(i,:) = var(data); % 计算方差
end
% 对每个测试样本进行分类
predicted_label = zeros(size(test_data, 1), 1); % 预测的标签
for i = 1:size(test_data, 1) % 遍历每个测试样本
x = test_data(i,:); % 取出当前测试样本
% 计算当前测试样本在每个类别下的概率密度函数值
p = zeros(3, 1); % 每个类别的概率密度函数值
for j = 1:3 % 遍历三个类别
p(j) = prod(normpdf(x, mu(j,:), sqrt(sigma(j,:)))); % 计算概率密度函数值
end
[~, idx] = max(p); % 取概率密度函数值最大的类别
predicted_label(i) = idx-1; % 对应标签为0、1、2
end
% 计算分类指标
accuracy = sum(predicted_label == test_label) / length(test_label); % 准确率
precision = zeros(3, 1); % 精确率
recall = zeros(3, 1); % 召回率
f_measure = zeros(3, 1); % F度量
for i = 1:3 % 遍历三个类别
TP = sum(predicted_label == i-1 & test_label == i-1); % 真正例
FP = sum(predicted_label == i-1 & test_label ~= i-1); % 假正例
FN = sum(predicted_label ~= i-1 & test_label == i-1); % 假反例
TN = sum(predicted_label ~= i-1 & test_label ~= i-1); % 真反例
precision(i) = TP / (TP + FP); % 精确率
recall(i) = TP / (TP + FN); % 召回率
f_measure(i) = 2 * precision(i) * recall(i) / (precision(i) + recall(i)); % F度量
end
mean_precision = mean(precision); % 平均精确率
mean_recall = mean(recall); % 平均召回率
mean_f_measure = mean(f_measure); % 平均F度量
% 显示所有数据
disp(['Train data: ', num2str(size(train_data))]);
disp(['Train label: ', num2str(size(train_label))]);
disp(['Test data: ', num2str(size(test_data))]);
disp(['Test label: ', num2str(size(test_label))]);
disp(['Predicted label: ', num2str(size(predicted_label))]);
disp(['Accuracy: ', num2str(accuracy)]);
disp(['Precision: ', num2str(precision')]);
disp(['Recall: ', num2str(recall')]);
disp(['F-measure: ', num2str(f_measure')]);
disp(['Mean precision: ', num2str(mean_precision)]);
disp(['Mean recall: ', num2str(mean_recall)]);
disp(['Mean F-measure: ', num2str(mean_f_measure)]);
```
希望这次修改能够帮到你,如果还有问题请随时提出。
阅读全文