写一个贝叶斯分类器示例代码,数据由csv文件通过pandas读取
时间: 2024-10-16 20:10:14 浏览: 24
贝叶斯分类器是一种基于概率统计的机器学习算法,主要用于分类任务。这里我们使用Python的scikit-learn库编写一个简单的贝叶斯分类器示例,假设我们的数据存储在一个CSV文件中,并使用Pandas库进行数据处理。
```python
# 导入必要的库
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score
# 加载数据
data = pd.read_csv('your_data.csv') # 将'your_data.csv'替换为实际文件路径
X = data['feature_column'] # 特征列名
y = data['target_column'] # 目标变量列名
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 文本特征提取,这里假设是文本数据,使用CountVectorizer
vectorizer = CountVectorizer()
X_train_vec = vectorizer.fit_transform(X_train)
X_test_vec = vectorizer.transform(X_test)
# 使用朴素贝叶斯分类器
clf = MultinomialNB()
clf.fit(X_train_vec, y_train)
# 预测
y_pred = clf.predict(X_test_vec)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
#
阅读全文