写一个 python 短文本分类
时间: 2023-10-10 14:05:24 浏览: 52
基于cnn+tensorflow实现的短文本分类
好的,以下是一个简单的 Python 短文本分类的示例代码,使用了 scikit-learn 库的朴素贝叶斯分类器:
```python
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
# 训练数据
texts = ["这是一个正面的例子", "这是一个负面的例子", "这是另外一个正面的例子", "还有一个负面的例子"]
labels = ["positive", "negative", "positive", "negative"]
# 特征提取器
vectorizer = CountVectorizer()
# 将文本转换为向量
X = vectorizer.fit_transform(texts)
# 训练分类器
classifier = MultinomialNB()
classifier.fit(X, labels)
# 预测新的文本
new_text = "这是一个很棒的产品"
new_vector = vectorizer.transform([new_text])
predicted_label = classifier.predict(new_vector)[0]
print(predicted_label)
```
在此示例中,我们使用朴素贝叶斯分类器对正面和负面的文本进行分类。我们首先使用 CountVectorizer 对文本进行特征提取,将其转换为向量。然后,我们使用 MultinomialNB 训练分类器,并使用新的文本进行分类预测。
阅读全文