使用贝叶斯分类函数对鸢尾花数据集进行分类
时间: 2024-11-25 17:15:06 浏览: 77
贝叶斯分类是一种基于概率统计的机器学习算法,尤其适用于文本分类、垃圾邮件过滤等场景。在Python的scikit-learn库中,可以使用sklearn.naive_bayes
模块中的GaussianNB
或MultinomialNB
类来对鸢尾花数据集(Iris dataset)进行分类。鸢尾花数据集是一个经典的多类别分类问题,包含了三种鸢尾花物种(Setosa、Versicolour和Virginica)。
首先,你需要导入所需的库,加载数据集,并对其进行预处理。然后,可以按照以下步骤操作:
加载数据:使用
load_iris()
函数从sklearn.datasets
导入鸢尾花数据。from sklearn import datasets iris = datasets.load_iris()
数据划分:通常会将数据分为训练集和测试集,比如80%用于训练,20%用于测试。
from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2)
模型初始化:选择合适的Naive Bayes模型,如高斯朴素贝叶斯(GaussianNB)。
from sklearn.naive_bayes import GaussianNB gnb = GaussianNB()
拟合模型:用训练数据拟合模型。
gnb.fit(X_train, y_train)
预测:用测试集进行预测。
y_pred = gnb.predict(X_test)
评估:计算模型的性能指标,如准确率、精确度等。
相关推荐















