python对txt文件进行评论词频统计和词云图可视化
时间: 2023-10-13 12:08:50 浏览: 105
python文件词频统计
好的,以下是Python对txt文件进行评论词频统计和词云图可视化的代码:
```
import jieba
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取txt文件
with open('comments.txt', 'r', encoding='utf-8') as f:
comments = f.read()
# 使用jieba分词
words = jieba.cut(comments)
# 统计词频
word_counts = Counter(words)
# 生成词云图
wc = WordCloud(font_path='msyh.ttc', width=800, height=600, background_color='white')
wc.generate_from_frequencies(word_counts)
# 显示词云图
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()
```
其中,`jieba`模块用于中文分词,`collections`模块用于统计词频,`wordcloud`模块用于生成词云图,`matplotlib`库用于显示词云图。
需要将要统计的评论保存为`comments.txt`文件放在与代码同一个目录下。如果需要更改词云图的字体、大小、背景颜色等属性,可以在`WordCloud`类的构造函数中进行修改。运行代码后,即可生成词云图并在窗口中显示。
阅读全文