python 贝叶斯分类
时间: 2023-11-17 16:02:17 浏览: 148
Python中的贝叶斯分类器是一种基于贝叶斯定理的分类器,它可以用于文本分类、垃圾邮件过滤、情感分析等任务。具体来说,朴素贝叶斯分类器是一种基于贝叶斯定理和特征条件独立假设的分类器,它假设每个特征与其他特征都是独立的,并且每个特征对分类的影响是相同的。在训练阶段,朴素贝叶斯分类器会根据给定的训练数据集计算出每个类别的先验概率和每个特征在每个类别下的条件概率。在预测阶段,朴素贝叶斯分类器会根据贝叶斯定理和条件独立性假设计算出每个类别的后验概率,并选择具有最高后验概率的类别作为预测结果。
下面是一个简单的Python代码示例,用于训练和测试朴素贝叶斯分类器:
```python
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import CountVectorizer
# 训练数据
train_data = ['this is good', 'this is bad', 'good good good', 'bad bad bad']
train_labels = ['positive', 'negative', 'positive', 'negative']
# 特征提取
vectorizer = CountVectorizer()
train_features = vectorizer.fit_transform(train_data)
# 训练朴素贝叶斯分类器
clf = MultinomialNB()
clf.fit(train_features, train_labels)
# 测试数据
test_data = ['this is good', 'this is bad']
test_features = vectorizer.transform(test_data)
# 预测结果
pred_labels = clf.predict(test_features)
print(pred_labels) # 输出 ['positive' 'negative']
```