高斯朴素贝叶斯在Universal Bank数据集上的分类代码
时间: 2024-10-25 12:14:07 浏览: 34
高斯朴素贝叶斯(Gaussian Naive Bayes)是一种基于概率的机器学习算法,常用于文本分类等场景。在Python中,我们可以使用sklearn库中的`GaussianNB`来进行分类。以下是使用Universal Bank数据集(假设已经预处理好)的一个简单示例:
```python
from sklearn.datasets import load_banknote
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.naive_bayes import GaussianNB
import pandas as pd
# 加载数据集(这里假设数据是一个CSV文件)
data = pd.read_csv('universal_bank_data.csv') # 替换为实际数据路径
X = data.drop('Class', axis=1) # 假设最后一列是目标变量
y = data['Class']
# 数据预处理,对数值特征做标准化处理
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
# 创建并训练高斯朴素贝叶斯模型
gnb = GaussianNB()
gnb.fit(X_train, y_train)
# 进行预测
predictions = gnb.predict(X_test)
# 计算性能指标
from sklearn.metrics import classification_report
print("Classification Report:\n", classification_report(y_test, predictions))
```
注意:在运行此代码之前,你需要确保Universal Bank数据集可用并且结构适合用作分类任务。如果实际的数据集不同,可能需要调整特征选择、预处理步骤以及评估指标。
阅读全文