数据挖掘实现朴素贝叶斯算法
时间: 2023-10-02 20:05:33 浏览: 89
朴素贝叶斯算法是一种基于贝叶斯定理的分类算法,它假设特征之间是相互独立的,因此被称为“朴素”。
下面是使用Python实现朴素贝叶斯算法的示例代码:
import pandas as pd
import numpy as np
# 加载数据集
data = pd.read_csv("data.csv")
# 将数据集划分为训练集和测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(data[['特征1', '特征2', '特征3', ...]], data['标签'], test_size=0.2)
# 训练朴素贝叶斯分类器
from sklearn.naive_bayes import GaussianNB
classifier = GaussianNB()
classifier.fit(X_train, y_train)
# 在测试集上预测
y_pred = classifier.predict(X_test)
# 计算准确率
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_test, y_pred)
print("准确率:", accuracy)
在上面的代码中,data.csv
是包含特征和标签的数据集,train_test_split
函数用于将数据集随机分为训练集和测试集,GaussianNB
是使用高斯分布的朴素贝叶斯分类器,accuracy_score
函数用于计算分类器在测试集上的准确率。
需要注意的是,朴素贝叶斯算法假设特征之间是相互独立的,因此在实际应用中需要对数据进行预处理,例如去除相关性较强的特征,避免算法的错误分类。
相关推荐
















