python文本分类代码
时间: 2023-09-13 08:08:29 浏览: 108
Python实现文本分类(卷积实现).zip
5星 · 资源好评率100%
下面是一个使用朴素贝叶斯算法进行文本分类的Python代码示例:
``` python
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
# 读入数据
data = pd.read_csv('data.csv', encoding='utf-8')
# 分割数据
x = data['text']
y = data['category']
# 特征提取
vectorizer = CountVectorizer()
x_train = vectorizer.fit_transform(x)
# 训练模型
model = MultinomialNB()
model.fit(x_train, y)
# 预测分类
new_text = ['这是一篇关于科技的文章']
new_text_vec = vectorizer.transform(new_text)
predicted_category = model.predict(new_text_vec)
print(predicted_category)
```
其中,'data.csv' 是包含训练数据的 CSV 文件,其中至少应该包含 'text' 和 'category' 两列。在上面的代码中,我们使用 `pandas` 库将数据读入到 DataFrame 中,然后使用 `sklearn` 库的 `CountVectorizer` 类将文本转换为向量,最后使用 `MultinomialNB` 类训练模型并进行预测。
阅读全文