朴素贝叶斯分类器python
时间: 2023-10-14 20:28:05 浏览: 77
python实现朴素贝叶斯分类器
5星 · 资源好评率100%
朴素贝叶斯分类器是一种基于贝叶斯定理和特征条件独立假设的分类算法,常用于文本分类、垃圾邮件过滤等领域。
在Python中,我们可以使用sklearn库中的朴素贝叶斯分类器实现分类任务。下面是一个简单的例子:
```python
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import CountVectorizer
# 创建文本数据集
texts = ["this is a good book", "this is a bad book", "good movie", "bad movie"]
labels = [1, 0, 1, 0]
# 将文本转换为词频矩阵
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(texts)
# 创建并训练朴素贝叶斯分类器
clf = MultinomialNB()
clf.fit(X, labels)
# 测试新数据
new_text = ["very good book"]
new_X = vectorizer.transform(new_text)
result = clf.predict(new_X)
print(result) # 输出1,表示为正面评价
```
其中,CountVectorizer用于将文本转换为词频矩阵,MultinomialNB为多项式朴素贝叶斯分类器。在训练和测试时,需要将文本转换为词频矩阵,并将标签传入分类器中进行训练和预测。
阅读全文