用python实现一个朴素贝叶斯分类器
时间: 2023-12-27 12:05:13 浏览: 87
好的,下面是一个简单的朴素贝叶斯分类器的Python实现:
```python
import numpy as np
class NaiveBayes:
def fit(self, X, y):
n_samples, n_features = X.shape
self.classes = np.unique(y)
n_classes = len(self.classes)
# 初始化均值、方差和先验概率
self.mean = np.zeros((n_classes, n_features))
self.var = np.zeros((n_classes, n_features))
self.prior = np.zeros(n_classes)
# 计算每个类别的均值、方差和先验概率
for c in self.classes:
X_c = X[c == y]
self.mean[c, :] = X_c.mean(axis=0)
self.var[c, :] = X_c.var(axis=0)
self.prior[c] = X_c.shape[0] / float(n_samples)
def predict(self, X):
y_pred = [self._predict(x) for x in X]
return np.array(y_pred)
def _predict(self, x):
posteriors = []
# 计算每个类别的后验概率
for idx, c in enumerate(self.classes):
prior = np.log(self.prior[idx])
class_conditional = np.sum(np.log(self._pdf(idx, x)))
posterior = prior + class_conditional
posteriors.append(posterior)
# 返回具有最大后验概率的类别
return self.classes[np.argmax(posteriors)]
def _pdf(self, class_idx, x):
mean = self.mean[class_idx]
var = self.var[class_idx]
numerator = np.exp(-(x - mean) ** 2 / (2 * var))
denominator = np.sqrt(2 * np.pi * var)
return numerator / denominator
```
这个朴素贝叶斯分类器可以用于二元分类和多元分类。在 `fit` 方法中,我们根据训练数据计算每个类别的均值、方差和先验概率。在 `_predict` 方法中,我们计算每个类别的后验概率,并返回具有最大后验概率的类别作为预测结果。
在上面的代码中,我们使用了对数概率,避免了计算机器精度问题。同时,我们还使用了高斯分布作为类条件概率分布,因为特征的概率分布往往呈现高斯分布。
阅读全文