用python 打出西游记人物出场次数，并生成词云库，

好的，下面是Python实现方法：首先，我们需要读取西游记的文本文件，并使用jieba分词库对其进行分词，然后统计人物出现的次数。 ```python import jieba from collections import Counter import wordcloud import matplotlib.pyplot as plt # 读取文本文件 with open('西游记.txt', 'r', encoding='utf-8') as f: text = f.read() # 使用jieba分词进行分词 words = jieba.lcut(text) # 统计人物出现的次数 # 人物名单可以根据需求自行添加或删除 counts = Counter() for i in range(len(words) - 1): if words[i] == '孙悟空' or words[i] == '悟空' or words[i] == '行者': if words[i+1] == '大圣' or words[i+1] == '孙行者' or words[i+1] == '齐天大圣': counts['孙悟空'] += 1 elif words[i] == '唐僧' or words[i] == '师父': if words[i+1] == '三藏' or words[i+1] == '玄奘': counts['唐僧'] += 1 elif words[i] == '沙僧' or words[i] == '悟净' or words[i] == '悟能': if words[i+1] == '沙和尚' or words[i+1] == '悟净' or words[i+1] == '悟能': counts['沙僧'] += 1 elif words[i] == '猪八戒' or words[i] == '八戒' or words[i] == '猪悟能': if words[i+1] == '天蓬元帅' or words[i+1] == '猪悟能': counts['猪八戒'] += 1 elif words[i] == '观音' or words[i] == '菩萨': if words[i+1] == '观世音菩萨' or words[i+1] == '菩萨': counts['观音'] += 1 # 输出出现次数前5的人物名和次数 top_counts = counts.most_common(5) for name, count in top_counts: print(name, count) ``` 接下来，我们需要生成词云图。使用wordcloud库可以轻松生成词云图。 ```python # 生成词云图 wc = wordcloud.WordCloud(width=800, height=600, background_color='white') wc.generate_from_frequencies(counts) plt.imshow(wc, interpolation='bilinear') plt.axis('off') plt.show() ``` 完整代码如下： ```python import jieba from collections import Counter import wordcloud import matplotlib.pyplot as plt # 读取文本文件 with open('西游记.txt', 'r', encoding='utf-8') as f: text = f.read() # 使用jieba分词进行分词 words = jieba.lcut(text) # 统计人物出现的次数 # 人物名单可以根据需求自行添加或删除 counts = Counter() for i in range(len(words) - 1): if words[i] == '孙悟空' or words[i] == '悟空' or words[i] == '行者': if words[i+1] == '大圣' or words[i+1] == '孙行者' or words[i+1] == '齐天大圣': counts['孙悟空'] += 1 elif words[i] == '唐僧' or words[i] == '师父': if words[i+1] == '三藏' or words[i+1] == '玄奘': counts['唐僧'] += 1 elif words[i] == '沙僧' or words[i] == '悟净' or words[i] == '悟能': if words[i+1] == '沙和尚' or words[i+1] == '悟净' or words[i+1] == '悟能': counts['沙僧'] += 1 elif words[i] == '猪八戒' or words[i] == '八戒' or words[i] == '猪悟能': if words[i+1] == '天蓬元帅' or words[i+1] == '猪悟能': counts['猪八戒'] += 1 elif words[i] == '观音' or words[i] == '菩萨': if words[i+1] == '观世音菩萨' or words[i+1] == '菩萨': counts['观音'] += 1 # 输出出现次数前5的人物名和次数 top_counts = counts.most_common(5) for name, count in top_counts: print(name, count) # 生成词云图 wc = wordcloud.WordCloud(width=800, height=600, background_color='white') wc.generate_from_frequencies(counts) plt.imshow(wc, interpolation='bilinear') plt.axis('off') plt.show() ``` 注意事项： - 代码中的人物名单可以根据需求自行添加或删除。 - 为了避免词云图中出现单个汉字，可以使用WordCloud库的stopwords参数去掉停用词，例如：`wc = wordcloud.WordCloud(width=800, height=600, background_color='white', stopwords={'的', '了', '是', '在', '和', '也', '就', '等'})`。 - 由于西游记文本比较大，分析时间可能会比较长，建议在测试时使用较小的文本文件。

阅读全文

用python 打出西游记人物出场次数，并生成词云库，

相关推荐

Python统计西游记主要人物出场次数（使用jieba分词）.zip

使用python制作词云

词云生成，Python

python西游记人物出场

python词云库wordcloud的使用方法与实例详解

word_cloud：在Jupyter Notebook和Python应用程序中使用的Python词云库

python词云库wordCloud使用方法详解(解决中文乱码)

python实现eth助记词导入生成地址

Python 用Python实现文件对比分析并生成报告 Python源码

Python文本统计功能之西游记用字统计操作示例

西游记素材用于python结巴分词可视化素材

使用Python编写程序，统计书籍《红楼梦》中前20位出场次数最多的人物

分析三国演义和红楼梦，进行中文分词，统计人物出场频次，生成词云图

基于Python第三方插件实现西游记章节标注汉语拼音的方法

使用python根据人物图像生成卡通图像的源码

Python 电商关键词分析并生成词云图 Python源码

python生成验证码

用Python生成随机验证码

python3生成图片，Python3生成图片源码下载

使用Python实现文字转语音并生成wav文件的例子

最新推荐

Python读取Excel数据并生成图表过程解析

Python自动生成代码 使用tkinter图形化操作并生成代码框架

Python导入数值型Excel数据并生成矩阵操作

Python使用QRCode模块生成二维码实例详解

使用python脚本自动生成K8S-YAML的方法示例

Java集合ArrayList实现字符串管理及效果展示

管理建模和仿真的文件

【MATLAB信号处理优化】：算法实现与问题解决的实战指南

在西门子S120驱动系统中，更换SMI20编码器时应如何确保数据的正确备份和配置？

实现2D3D相机拾取射线的关键技术

Python自动生成代码使用tkinter图形化操作并生成代码框架