import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt txt = open("longzu.txt", "r", encoding='utf-8').read() #使用jieba分词 words = jieba.lcut(txt) #过滤掉一些无用词汇 stop_words = set(['的','了','是','在','我','你','他','她','我们','他们','她们']) words = [word for word in words if word not in stop_words] wordcloud = WordCloud(font_path='msyh.ttc',width=800,height=600,background_color='white').generate(''.join(words)) #显示词云 plt.imshow(wordcloud,interpolation='bilinear') plt.axis('off') plt.show() #关键词出现次数 counts = {} for word in words: if len(word) == 1: continue else: counts[word]=counts.get(word,0)+1 items = list(counts.items()) items.sort(key=lambda x:x[1],reverse=True) for i in range(15): word,count = items[i] print("{0:<10}{1:>5}".format(word,count))设计思路
时间: 2023-11-22 14:04:54 浏览: 46
这段代码是一个简单的中文词云生成器。它的设计思路如下:
1. 读取《龙族》小说的文本文件,并使用jieba分词工具将文本分成一个个词汇。
2. 过滤掉一些常用但无意义的词汇,如“的”、“了”、“是”等等。
3. 使用WordCloud库生成词云图像,并指定字体、大小和背景颜色。
4. 显示词云图像。
5. 统计每个词汇出现的次数,并按照出现次数排序。
6. 输出出现次数最多的前15个词汇及其出现次数。
总体来说,这段代码的实现思路比较简单,主要是使用jieba分词和WordCloud库生成词云图像。同时,它还使用了字典来统计每个词汇出现的次数,方便后续的排序和输出。
相关问题
解释一下这串代码import requests import xlwt import re from wordcloud import WordCloud import jieba import matplotlib.pyplot as plt
这串代码是Python代码,主要使用了requests、xlwt、re、WordCloud、jieba和matplotlib.pyplot等库,实现了一些文字处理相关的功能,比如从网页中获取数据、将数据存储到Excel表格中、进行正则表达式匹配、生成词云等。
请帮我解释这段代码import requests import xlwt import re from wordcloud import WordCloud import jieba import matplotlib.pyplot as plt
这段代码是Python语言的代码,使用了几个库:requests库,xlwt库,re库,wordcloud库,jieba库和matplotlib库。requests库可以用来向网页发送请求并获取响应,xlwt库可以将数据写入Excel文件,re库提供了正则表达式工具,wordcloud库可以制作词云,jieba库是用于中文分词的库,matplotlib库可以制作各种图表。代码中先导入了这几个库,然后引入相应的功能。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)