利用机器学习库对测试集和训练集进行情感二分类的代码
时间: 2023-08-23 19:03:53 浏览: 40
以下是使用Scikit-learn进行情感二分类的代码示例:
```python
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score
# 加载数据集
df = pd.read_csv('data.csv')
# 分词
vectorizer = CountVectorizer(stop_words='english')
X = vectorizer.fit_transform(df['text'])
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, df['label'], test_size=0.2, random_state=42)
# 训练模型
clf = MultinomialNB()
clf.fit(X_train, y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 评估模型性能
print('Accuracy:', accuracy_score(y_test, y_pred))
```
其中,`data.csv`是包含`text`和`label`两列的数据集,`text`是文本数据,`label`是情感标签(0表示负面情感,1表示正面情感)。`CountVectorizer`用于将文本数据转换为向量表示,`MultinomialNB`是朴素贝叶斯分类器,`accuracy_score`用于计算准确率。