通过多项式朴素贝叶斯对Excel中4000条评论进行情感分析的Python代码
时间: 2024-03-05 14:49:10 浏览: 66
基于机器学习的电商评论情感分析系统
以下是一个简单的Python代码示例,用于通过多项式朴素贝叶斯对Excel中4000条评论进行情感分析:
```python
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
# 读取Excel文件
df = pd.read_excel('comments.xlsx')
# 文本预处理
# 去除标点符号、停用词、数字等
# 将评论转换为数字向量
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(df['comment'])
# 将情感标签转换为数字标签
y = df['sentiment'].replace({'positive': 1, 'negative': -1, 'neutral': 0})
# 划分测试集和训练集
train_size = int(len(df) * 0.8)
X_train, X_test, y_train, y_test = X[:train_size], X[train_size:], y[:train_size], y[train_size:]
# 训练多项式朴素贝叶斯分类器
clf = MultinomialNB()
clf.fit(X_train, y_train)
# 对新的评论进行情感分析
new_comments = ['这个产品真的很好用!', '这个产品质量很差,不建议购买。']
X_new = vectorizer.transform(new_comments)
y_new = clf.predict(X_new)
# 输出预测结果
for comment, sentiment in zip(new_comments, y_new):
print(f'{comment}: {sentiment}')
```
需要注意的是,以上代码仅为示例,实际情况中需要根据具体数据集进行调整和优化。
阅读全文