首页利用jieba库 wordcloud词频统计

利用jieba库 wordcloud词频统计

时间: 2023-11-11 21:02:34 浏览: 99

首先需要安装jieba和wordcloud库，在终端输入以下命令： ``` pip install jieba pip install wordcloud ``` 接下来我们来看一个简单的示例： ```python import jieba from wordcloud import WordCloud # 读取文本文件 with open('text.txt', 'r', encoding='utf-8') as f: text = f.read() # 对文本进行分词 words = jieba.cut(text) # 将分词结果组成字符串 content = ' '.join(words) # 生成WordCloud对象 wc = WordCloud(background_color='white', width=800, height=600) # 生成词云图像 wc.generate(content) # 将词云图像保存到文件 wc.to_file('wordcloud.png') ``` 这个示例中，我们首先使用jieba库对文本进行分词，然后将分词结果组成一个字符串。接着，我们使用WordCloud类生成一个词云图像，并将其保存到文件中。如果要统计词频，可以使用Python的collections库。示例如下： ```python import jieba from collections import Counter # 读取文本文件 with open('text.txt', 'r', encoding='utf-8') as f: text = f.read() # 对文本进行分词 words = jieba.cut(text) # 统计词频 counter = Counter(words) # 打印前10个出现频率最高的词 for word, count in counter.most_common(10): print(word, count) ``` 这个示例中，我们使用Counter类统计分词结果中每个词出现的次数，并打印出现频率最高的前10个词。

阅读全文