朴素贝叶斯处理鸢尾花数据集代码
时间: 2023-07-24 08:22:33 浏览: 122
以下是使用朴素贝叶斯处理鸢尾花数据集的Python代码示例:
```python
import pandas as pd
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score
# 加载鸢尾花数据集
iris = load_iris()
# 将数据集转换为DataFrame格式
df = pd.DataFrame(data=np.c_[iris['data'], iris['target']], columns=iris['feature_names'] + ['target'])
df['target'] = df['target'].map({0: 'setosa', 1: 'versicolor', 2: 'virginica'})
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(df[iris.feature_names], df['target'], test_size=0.3, random_state=0)
# 创建朴素贝叶斯分类器
model = GaussianNB()
# 训练模型
model.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)
```
这里同样使用了sklearn库中的高斯贝叶斯分类器模型,因为这个模型就是朴素贝叶斯分类器中的一种。同样将鸢尾花数据集分为训练集和测试集,然后训练模型并在测试集上进行预测,最后计算准确率。
阅读全文