写一个贝叶斯分类器示例代码,数据由csv文件通过pandas读取,不能使用任何高级模型
时间: 2024-10-16 07:10:19 浏览: 42
贝叶斯分类器是一种基于概率统计的简单而有效的机器学习算法,尤其适合处理文本分类等任务。这里是一个简单的Python示例,使用pandas库读取CSV数据,sklearn库实现朴素贝叶斯分类:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
# 1. 加载数据
data = pd.read_csv('your_data.csv') # 请替换为实际文件名
X = data['text_column'] # 输入特征,假设是'text_column'
y = data['target_column'] # 目标变量
# 2. 数据预处理
vectorizer = CountVectorizer() # 将文本转换为词频向量
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 3. 特征提取
X_train_vec = vectorizer.fit_transform(X_train)
X_test_vec = vectorizer.transform(X_test)
# 4. 训练贝叶斯分类器
classifier = MultinomialNB()
classifier.fit(X_train_vec, y_train)
# 5. 预测
predictions = classifier.predict(X_test_vec)
# 6. 评估性能
accuracy = classifier.score(X_test_vec, y_test)
print("Accuracy:", accuracy)
#
阅读全文