首页人工智能文本分类相关代码

人工智能文本分类相关代码

时间: 2024-03-11 11:20:11 浏览: 22

以下是一个简单的文本分类代码示例，使用朴素贝叶斯算法： ```python import pandas as pd from sklearn.model_selection import train_test_split from sklearn.feature_extraction.text import CountVectorizer from sklearn.naive_bayes import MultinomialNB from sklearn.metrics import accuracy_score # 读取数据 df = pd.read_csv('data.csv') # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(df['text'], df['label'], test_size=0.2, random_state=42) # 特征提取 vectorizer = CountVectorizer() X_train = vectorizer.fit_transform(X_train) X_test = vectorizer.transform(X_test) # 模型训练 clf = MultinomialNB() clf.fit(X_train, y_train) # 模型评估 y_pred = clf.predict(X_test) accuracy = accuracy_score(y_test, y_pred) print('Accuracy: ', accuracy) ``` 在这个示例中，我们首先读取了一个包含文本和标签的 CSV 文件。然后，我们使用 `train_test_split` 函数将数据集分成训练集和测试集。接下来，我们使用 `CountVectorizer` 对文本进行特征提取，将文本转换为数字向量。最后，我们使用 `MultinomialNB` 进行训练，并使用测试集评估模型的准确性。