python对表格评论进词云图
时间: 2023-07-07 22:45:43 浏览: 103
可以使用 Pandas 库读取表格数据,然后使用 jieba 库对评论文本进行分词,最后使用 WordCloud 库生成词云图。以下是一个示例代码,假设表格数据保存在 `comments.csv` 文件中,其中 `comments` 列包含评论文本:
```python
import pandas as pd
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取表格数据
df = pd.read_csv('comments.csv')
# 合并评论文本
text = ' '.join(df['comments'].tolist())
# 分词
words = jieba.cut(text)
# 去除停用词
stopwords = set(pd.read_csv('stopwords.txt', header=None)[0]) # 停用词表保存在 stopwords.txt 文件中
words = [word for word in words if word not in stopwords]
# 生成词云图
wordcloud = WordCloud(width=800, height=800, background_color='white').generate(' '.join(words))
plt.figure(figsize=(8, 8), facecolor=None)
plt.imshow(wordcloud)
plt.axis('off')
plt.tight_layout(pad=0)
plt.show()
```
需要注意的是,上面代码中的 `stopwords.txt` 文件保存了中文的停用词列表,可以从互联网上找到常用的停用词表,或者根据具体的需求自行定义。
阅读全文