使用matlab实现knn
时间: 2023-12-06 19:08:39 浏览: 214
以下是使用Matlab实现KNN算法的一个简单示例:
1.加载数据集
假设我们有一个数据集,其中包含两个特征x和y,以及一个类别标签label。我们可以将数据集存储在一个m x 3的矩阵中,其中m是样本数。在Matlab中,我们可以使用csvread函数来加载csv格式的数据集文件。
```matlab
data = csvread('dataset.csv');
```
2.划分训练集和测试集
将数据集划分为训练集和测试集,其中训练集用于训练模型,测试集用于评估模型性能。在这个例子中,我们将数据集的前80%用作训练集,后20%用作测试集。
```matlab
trainData = data(1:round(0.8*size(data,1)),:);
testData = data(round(0.8*size(data,1))+1:end,:);
```
3.计算距离
对于每个测试样本,我们需要计算它与训练集中所有样本的距离。在这个例子中,我们使用欧几里得距离计算两个样本之间的距离。
```matlab
k = 5; % 设置k值
for i = 1:size(testData,1)
distances = sqrt(sum((trainData(:,1:2)-testData(i,1:2)).^2,2)); % 计算距离
[sortedDistances,idx] = sort(distances); % 排序
kNearestLabels = trainData(idx(1:k),3); % 取前k个样本的类别标签
predictedLabel(i) = mode(kNearestLabels); % 众数作为预测标签
end
```
4.评估模型性能
我们可以使用混淆矩阵来评估模型的性能。混淆矩阵可以显示实际类别和预测类别之间的关系。
```matlab
confMat = confusionmat(testData(:,3),predictedLabel);
accuracy = sum(diag(confMat))/sum(confMat(:)); % 计算准确率
```
完整的代码示例:
```matlab
data = csvread('dataset.csv');
trainData = data(1:round(0.8*size(data,1)),:);
testData = data(round(0.8*size(data,1))+1:end,:);
k = 5; % 设置k值
for i = 1:size(testData,1)
distances = sqrt(sum((trainData(:,1:2)-testData(i,1:2)).^2,2)); % 计算距离
[sortedDistances,idx] = sort(distances); % 排序
kNearestLabels = trainData(idx(1:k),3); % 取前k个样本的类别标签
predictedLabel(i) = mode(kNearestLabels); % 众数作为预测标签
end
confMat = confusionmat(testData(:,3),predictedLabel);
accuracy = sum(diag(confMat))/sum(confMat(:)); % 计算准确率
disp(['Accuracy: ' num2str(accuracy)]);
```
阅读全文