根据关键词文档a.txt,对文档h.txt进行关键词词频统计,并根据相应词频绘制词云图,python代码怎么写
时间: 2023-03-30 18:05:01 浏览: 155
基于Python实现的词云生成代码,从txt文件中读取词语,生成指定图片的词云图
你好,关于你的问题,我可以回答。针对文档h.txt进行关键词词频统计,可以使用Python中的jieba库进行分词,然后使用collections库中的Counter函数进行词频统计。具体代码如下:
```
import jieba
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取文本文件
with open('h.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba进行分词
words = jieba.cut(text)
# 使用Counter进行词频统计
word_counts = Counter(words)
# 绘制词云图
wordcloud = WordCloud(font_path='msyh.ttc', background_color='white', width=800, height=600)
wordcloud.generate_from_frequencies(word_counts)
plt.imshow(wordcloud)
plt.axis('off')
plt.show()
```
其中,msyh.ttc是字体文件,需要提前下载并放在当前目录下。运行以上代码,即可得到文档h.txt的词云图。
阅读全文