p ython朴素贝叶斯分类
时间: 2024-01-16 15:05:17 浏览: 100
朴素贝叶斯分类 (Naive Bayes Classification) 是一种简单而有效的分类算法,常用于文本分类和垃圾邮件过滤等领域。在 Python 中,可以使用 scikit-learn 库中的 MultinomialNB 类来实现朴素贝叶斯分类。
下面是一个简单的例子,使用朴素贝叶斯分类器对 iris 数据集进行分类:
```python
from sklearn.datasets import load_iris
from sklearn.naive_bayes import MultinomialNB
from sklearn.model_selection import train_test_split
# 加载 iris 数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 训练朴素贝叶斯分类器
clf = MultinomialNB()
clf.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = clf.predict(X_test)
# 输出分类器的准确率
accuracy = clf.score(X_test, y_test)
print("Accuracy:", accuracy)
```
运行结果:
```
Accuracy: 0.9666666666666667
```
这个例子中使用的是 MultinomialNB 类,适用于特征值为离散化的情况。如果特征值为连续型变量,则可以使用 GaussianNB 类。
阅读全文