python朴素贝叶斯算法代码
时间: 2023-10-04 08:09:54 浏览: 49
以下是一个简单的Python实现朴素贝叶斯算法的代码示例:
```python
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score
# 读取数据
data = pd.read_csv('data.csv')
# 分离特征和标签
X = data.iloc[:, :-1]
y = data.iloc[:, -1]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建朴素贝叶斯分类器
clf = GaussianNB()
# 拟合模型
clf.fit(X_train, y_train)
# 预测结果
y_pred = clf.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
其中`data.csv`是包含特征和标签的数据文件,`GaussianNB`是高斯朴素贝叶斯分类器,`accuracy_score`是用于计算准确率的函数。
相关问题
python朴素贝叶斯算法
朴素贝叶斯算法是一种分类算法,它基于贝叶斯定理和特征条件独立假设来计算给定特征下某个类别出现的概率。在Python中,可以使用scikit-learn库中的MultinomialNB类来实现朴素贝叶斯分类器。以下是一个简单的示例代码:
```
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import CountVectorizer
# 创建特征向量和目标变量
X = ['this is a good book', 'this is a bad book', 'this is not a book']
y = ['positive', 'negative', 'negative']
# 将文本转换为特征向量
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(X)
# 训练朴素贝叶斯分类器
clf = MultinomialNB()
clf.fit(X, y)
# 预测新样本的类别
new_sample = ['this is a not good book']
new_sample_vec = vectorizer.transform(new_sample)
print(clf.predict(new_sample_vec))
```
在上面的代码中,我们使用CountVectorizer将文本转换为特征向量,并使用MultinomialNB训练朴素贝叶斯分类器。最后,我们使用该分类器对新样本进行分类。
朴素贝叶斯算法代码python鸢尾花
以下是使用朴素贝叶斯算法进行鸢尾花分类的 Python 代码:
```python
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score
# 加载鸢尾花数据集
iris = load_iris()
# 将数据集转换为 Pandas DataFrame 格式
df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
df['target'] = iris.target
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(df[iris.feature_names], df['target'], test_size=0.3, random_state=42)
# 创建朴素贝叶斯分类器
gnb = GaussianNB()
# 在训练集上拟合模型
gnb.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = gnb.predict(X_test)
# 计算模型的准确率
accuracy = accuracy_score(y_test, y_pred)
print('模型的准确率为:{:.2f}%'.format(accuracy * 100))
```
上述代码中,首先使用 `load_iris()` 函数加载鸢尾花数据集,然后将数据集转换为 Pandas DataFrame 格式。接着,使用 `train_test_split()` 函数将数据集分为训练集和测试集。然后,创建一个 GaussianNB 类的对象,即朴素贝叶斯分类器,并在训练集上拟合模型。最后,使用 `predict()` 函数在测试集上进行预测,并使用 `accuracy_score()` 函数计算模型的准确率。