利用朴素贝叶斯对鸢尾花的数据进行分类代码
时间: 2024-11-09 19:24:29 浏览: 24
朴素贝叶斯算法是一种基于概率统计的简单而强大的分类模型,它假设特征之间相互独立。在Python的Scikit-learn库中,我们可以很容易地利用`Iris`数据集对其进行分类。以下是一个简单的例子,展示了如何使用朴素贝叶斯对鸢尾花数据进行分类:
```python
# 导入必要的库
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score
# 加载鸢尾花数据集
iris = datasets.load_iris()
X = iris.data # 特征
y = iris.target # 类别标签
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建并训练朴素贝叶斯分类器
gnb = GaussianNB() # 使用高斯朴素贝叶斯模型,因为Iris数据通常适合连续特征
gnb.fit(X_train, y_train)
# 预测测试集
y_pred = gnb.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
阅读全文