cipintongji={} pattern = '|'.join(map(re.escape, separators)) for i in data['公司领域'].values: words = re.split(pattern, i) for i in words: word=i.strip() if word not in cipintongji.keys(): cipintongji[word]=1 else: cipintongji[word]+=1 wc = WordCloud(font_path='msyh.ttc', # 字体 background_color="white", # 颜色 max_words=50, # 词云显示的最大词数 width=1200, # 宽度 height=800, # 高度 # mask=back_coloring, # 背景图片 ) wc.generate_from_frequencies(cipintongji) # 显示图 plt.figure() plt.imshow(wc) plt.axis("off") plt.show()
时间: 2023-06-05 15:06:46 浏览: 147
python字典和json.dumps()的遇到的坑分析
这段代码的作用是将数据中的多个关键词进行切分,统计出各个关键词出现的频率,并且生成词云图。具体实现方式是:将数据中的分隔符用 | 连接成字符串 pattern,然后通过 re 模块的 split() 函数将字符串切分成多个单词,再循环遍历每个单词进行处理。将单词去除空格后,判断它是否出现在字典 cipintongji 的键中,如果出现则将对应的值加1,否则在字典中新建一个键值对,并将值初始化为1。最后通过 WordCloud 类生成词云图,指定字体路径等参数。
阅读全文