朴素贝叶斯多分类matlab,朴素贝叶斯分类matlab实现
时间: 2023-10-16 17:16:28 浏览: 126
朴素贝叶斯分类是一种基于贝叶斯定理的分类方法,它假设所有特征之间相互独立,即“朴素”地假设特征之间不存在关联。在训练阶段,朴素贝叶斯分类器通过统计每个类别下各个特征的概率分布来生成模型,然后在预测阶段,根据测试样本的特征值计算其属于各个类别的概率,最终将概率最大的类别作为预测结果。
下面是一个用MATLAB实现朴素贝叶斯多分类的示例代码:
```matlab
% 读取训练数据和测试数据
trainData = csvread('trainData.csv');
trainLabel = csvread('trainLabel.csv');
testData = csvread('testData.csv');
testLabel = csvread('testLabel.csv');
% 训练朴素贝叶斯分类器
nb = fitcnb(trainData, trainLabel);
% 预测测试数据的类别
predictedLabel = predict(nb, testData);
% 计算预测准确率
accuracy = sum(predictedLabel == testLabel) / length(testLabel);
disp(['Accuracy = ' num2str(accuracy)]);
```
其中,`trainData` 是训练数据矩阵,每行代表一个样本,每列代表一个特征;`trainLabel` 是训练数据的类别标签向量;`testData` 是测试数据矩阵,与训练数据格式相同;`testLabel` 是测试数据的真实类别标签向量。
在训练阶段,`fitcnb` 函数会根据训练数据和类别标签训练出一个朴素贝叶斯分类器 `nb`,其中默认使用高斯分布来建模各个特征的概率分布。在预测阶段,`predict` 函数会根据测试数据计算其属于各个类别的概率,并返回概率最大的类别作为预测结果。最后,通过统计预测正确的样本数除以测试样本总数,计算出预测准确率。
需要注意的是,训练数据和测试数据需要以 CSV 格式存储,其中每行数据以逗号分隔各个特征值,最后一列为类别标签。同时,如果需要使用其他分布方式建模各个特征的概率分布,可以通过 `DistributionNames` 参数来指定。例如,若要使用多项式分布,可以将 `fitcnb` 函数改为如下形式:
```matlab
nb = fitcnb(trainData, trainLabel, 'DistributionNames', 'mn');
```
其中 `'mn'` 表示多项式分布。
阅读全文