贝叶斯水果分类器python代码
时间: 2024-11-07 12:11:05 浏览: 26
贝叶斯分类器是一种基于概率统计的简单而强大的机器学习算法,常用于文本分类、垃圾邮件识别等场景。在Python中,我们可以使用`sklearn`库中的`BayesClassifier`实现贝叶斯分类器,特别是朴素贝叶斯分类器(GaussianNB、MultinomialNB、BernoulliNB)。这里我将提供一个简单的示例,展示如何使用`MultinomialNB`对水果名称进行二分类。
```python
from sklearn.datasets import load_iris
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import Pipeline
# 加载数据集假设我们有一个包含水果名的数据集
# 这里我们简化为两个类别,例如"苹果"和"香蕉"
data = ["苹果", "苹果", "香蕉", "香蕉", "橙子"]
labels = [0, 0, 1, 1, 2] # 0代表苹果,1代表香蕉,2代表橙子
# 创建一个简单的分类管道
text_clf = Pipeline([
('vect', CountVectorizer()), # 文本特征提取
('clf', MultinomialNB()) # 朴素贝叶斯分类器
])
# 训练模型
text_clf.fit(data, labels)
# 示例预测一个新的水果
new_fruit = "梨"
prediction = text_clf.predict([new_fruit])
print(f"新水果'{new_fruit}'可能是:{prediction[0]}")
阅读全文