文本分类,直接写完整的python代码
时间: 2023-02-06 22:15:31 浏览: 47
文本分类是自然语言处理中常见的一种任务。它的目标是对输入的文本进行分类,将其归类到一个或多个预定义的类别中。下面是一个基于 Python 的文本分类的示例代码,使用了朴素贝叶斯分类器:
```
import nltk
from nltk.corpus import movie_reviews
# 建立特征提取器
def features(words):
return dict([(word, True) for word in words])
# 获取训练数据
neg_reviews = []
for fileid in movie_reviews.fileids('neg'):
words = movie_reviews.words(fileid)
neg_reviews.append((features(words), 'negative'))
pos_reviews = []
for fileid in movie_reviews.fileids('pos'):
words = movie_reviews.words(fileid)
pos_reviews.append((features(words), 'positive'))
# 将训练数据拆分为训练集和测试集
train_set = neg_reviews[:750] + pos_reviews[:750]
test_set = neg_reviews[750:] + pos_reviews[750:]
# 使用朴素贝叶斯分类器训练模型
classifier = nltk.NaiveBayesClassifier.train(train_set)
# 评估模型的准确率
accuracy = nltk.classify.accuracy(classifier, test_set)
print("Accuracy:", accuracy)
# 使用训练好的模型进行分类
review = "This movie is terrible"
words = review.split()
classification = classifier.classify(features(words))
print("Classification:", classification)
```
在这段代码中,我们首先获取了训练数据,然后将它拆分为训练集和测试集。然后,我们使用 nltk 库中的朴素贝叶斯分类器训练模
相关推荐

















