朴素贝叶斯文本分类代码
时间: 2023-08-10 09:06:10 浏览: 109
以下是一个简单的朴素贝叶斯文本分类的 Python 代码示例:
```python
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
# 读取数据集
df = pd.read_csv('text_data.csv')
# 创建词袋模型
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(df['text'])
# 创建分类器
clf = MultinomialNB()
y = df['category']
clf.fit(X, y)
# 预测新文本的类别
new_text = ["This is a new text to classify"]
X_new = vectorizer.transform(new_text)
predicted_category = clf.predict(X_new)
print(predicted_category)
```
其中,text_data.csv 是包含文本和对应类别的数据集,例如:
```
text,category
This is a positive review,positive
This is a negative review,negative
This is a neutral review,neutral
```
代码首先使用 pandas 库读取数据集,然后使用 CountVectorizer 创建词袋模型,将文本转换为特征向量。接着,使用 MultinomialNB 创建朴素贝叶斯分类器,拟合数据集并预测新文本的类别。最后,输出预测结果。
阅读全文