新闻文本分类python代码
时间: 2023-07-05 07:22:32 浏览: 150
python机器学习新闻文章文本分类
5星 · 资源好评率100%
以下是一个基于Python的新闻文本分类代码示例:
```
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
# 读取数据
data = pd.read_csv('news.csv')
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(data['text'], data['label'], random_state=0)
# 特征提取
count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(X_train)
# 训练分类器
clf = MultinomialNB().fit(X_train_counts, y_train)
# 对测试集进行预测
X_test_counts = count_vect.transform(X_test)
y_pred = clf.predict(X_test_counts)
# 输出准确率
print("Accuracy: ", np.mean(y_pred == y_test))
```
注:代码中的 `news.csv` 是包含 `text` 和 `label` 两列的新闻数据集。`text` 列包含新闻文本内容,`label` 列包含对应的分类标签。在该示例中,我们使用了朴素贝叶斯分类器来对新闻文本进行分类。
阅读全文