朴素贝叶斯python西瓜分类
时间: 2023-11-04 22:07:05 浏览: 195
python基于概率论的分类算法 朴素贝叶斯原理简单,也很容易实现,多用于文本分类
好的,针对朴素贝叶斯分类算法在Python中的应用,你可以按照以下步骤进行实现:
1. 准备数据集:从UCI机器学习库中下载西瓜数据集,并将其转换为适合朴素贝叶斯分类器使用的格式。
2. 分割数据集:将数据集分为训练集和测试集。
3. 训练模型:使用训练集训练朴素贝叶斯分类器。
4. 测试模型:使用测试集测试朴素贝叶斯分类器的准确率。
5. 使用模型:使用训练好的朴素贝叶斯分类器对新的西瓜进行分类。
下面是一个简单的示例代码:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
# 读取数据集
data = pd.read_csv('watermelon.csv')
# 将数据集分为特征和标签
X = data.iloc[:, :-1]
y = data.iloc[:, -1]
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
# 训练朴素贝叶斯分类器
clf = GaussianNB()
clf.fit(X_train, y_train)
# 测试模型准确率
accuracy = clf.score(X_test, y_test)
print('Accuracy:', accuracy)
# 使用模型进行预测
new_data = [[0.697, 0.460, 1],
[0.774, 0.376, 1],
[0.634, 0.264, 0],
[0.608, 0.318, 0]]
prediction = clf.predict(new_data)
print('Prediction:', prediction)
```
阅读全文