编写一段NLP文本分类
时间: 2024-05-02 19:23:35 浏览: 6
代码,使用Python语言和Scikit-learn库
好的,以下是一段NLP文本分类的代码,使用Python语言和Scikit-learn库:
```python
# 导入Scikit-learn库中的文本处理工具
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
# 定义文本内容与对应标签
texts = ["这是一条正常的短信。", "你的银行账户被盗刷了!", "哈哈哈哈哈,这个电影太好笑了。"]
labels = [0, 1, 0] # 0表示正常消息,1表示垃圾短信
# 使用CountVectorizer进行文本特征提取
vectorizer = CountVectorizer()
X_train = vectorizer.fit_transform(texts)
# 定义分类器
clf = MultinomialNB()
clf.fit(X_train, labels)
# 预测新的文本
new_texts = ["你的账户已经恢复正常了。", "免费领取1000元购物券!", "这部电影太无聊了。"]
X_test = vectorizer.transform(new_texts)
predicted_labels = clf.predict(X_test)
# 输出预测结果
for text, label in zip(new_texts, predicted_labels):
if label == 0:
print("{} -- 正常消息".format(text))
else:
print("{} -- 垃圾短信".format(text))
```
这段代码中,我们定义了三条文本信息以及对应的标签。我们使用CountVectorizer对文本进行特征提取,然后使用MultinomialNB进行文本分类。最后,我们使用训练好的模型预测三条新的文本信息,并输出其分类结果。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)