用jieba库编写程序统计《水浒传》中前10位出场最多的人物。

在Python中，我们可以使用jieba库进行分词，并结合字典数据结构来统计《水浒传》中人物的出场次数。首先需要准备一份《水浒传》文本数据，然后按照以下步骤操作： 1. **安装jieba库**：如果你还没有安装，可以使用`pip install jieba`命令进行安装。 ```bash pip install jieba ``` 2. **下载并加载词典**：jieba需要大词典来进行精确的分词，你可以从其官方网站下载`dict.txt.big`文件。 3. **读取并预处理文本**： - 读取文本文件，去除无关字符如标点符号。 - 使用jieba的`lcut`函数对文本进行分词。 4. **统计人物出场次数**： - 创建一个空字典存储每个角色及其出现次数。 - 遍历分词结果，如果词语是一个人名，则更新对应的计数。 5. **筛选出前10位**： - 对字典按值降序排序，获取出现次数最多的前10个人物。下面是一个简化的示例代码，假设已经有一个名为`water浒传.txt`的文本文件： ```python import jieba # 步骤3和4 def process_text(file_name): with open(file_name, 'r', encoding='utf-8') as f: text = f.read().replace('，', '').replace('。', '') # 去除逗号和句号 words = jieba.lcut(text) character_count = {} for word in words: if is_person_name(word): # 假设is_person_name()函数用于判断是否为人名 if word in character_count: character_count[word] += 1 else: character_count[word] = 1 # 步骤5 top_10_characters = sorted(character_count.items(), key=lambda x: x[1], reverse=True)[:10] return top_10_characters # 假设你需要添加一个人名识别函数 def is_person_name(name): # 实现具体的判断逻辑，例如使用已有的人名列表或命名规则 pass # 调用函数并打印结果 top_10 = process_text("water浒传.txt") for i, (character, count) in enumerate(top_10): print(f"{i+1}. {character}: {count} 出场")

阅读全文

用jieba库编写程序统计《水浒传》中前10位出场最多的人物。

相关推荐

使用Python和jieba库进行红楼梦人物统计与密码生成

使用Python和jieba库分析《水浒传》词频与停用词处理

Python jieba库：高效中文文本分词技术分享

利用jieba库编写程序统计《西游记》中前15位出场最多的人物

编写程序统计《水浒传》中出场最多的前10位人物。

编写python程序，统计红楼梦中前十位出场最多的人物，并生成词云图片

用python语音编写程序统计《红楼梦》中前20位出场最多的人物

《西游记》人物统计。编写程序统计《西游记》中前15位出场最多的人物。

《红楼梦》人物统计，编写程序统计《红楼梦》中前20位出场最多的人物。

《红楼梦》人物统计。编写程序统计《红楼梦》中前20位出场最多的人物。

《红楼梦》人物统计。编写程序统计《红楼梦》中的前20位出场最多的人物 程序输出效果如下：

pychaim用jieba库统计水浒传前五名人物及出场次数 按词的次数排序 代码加结果

《红楼梦》人物统计，编写程序统计《红楼梦》中前20位出场最多的人物。《红楼梦》文件在附件中 将源代码和运行结果截图提交

Python-[jieba库应用]-统计水浒传中人物出现次数

使用Python编写程序，统计书籍《红楼梦》中前20位出场次数最多的人物

python红楼梦人物统计前20位出场最多的人物

(5)利用jieba库，统计《红楼梦.txt》中人物的出场次数最多的前10人

编写程序，利用jieba库实现Hamet英文词频统计和《三国演义》人物出场统计。请你统计你想要的字的频率

使用jieba，请编写 python 程序，统计《三国演义》中出场次数排名前20的人物和对应的次数。

如何在Jupyter中利用jieba查询水浒传里的出现最多的前20个人物

大家在看

TwinSAFE EL6900 安全模块基础使用指南（针对TC3.1.4020.0版本）.pdf

南京工业大学Python程序设计语言题库及答案

泊松分布MATLAB代码-RJNS3D_VER_1.1:离散断裂网络建模

Skill.wz_冒险岛079WZ_079skill.wz_冒险岛的_冒险岛Skill.wz_冒险岛服务端_

Multisim里的NPN三极管参数资料大全.docx

最新推荐

python使用jieba实现中文分词去停用词方法示例

自动删除hal库spendsv、svc以及systick中断

流量主小程序 多功能工具箱小程序源码-操作简单实用.zip

世界地图Shapefile文件解析与测试指南

Python环境监控高可用构建：可靠性增强的策略

需要在matlab当中批量导入表格数据的指令

Sqlcipher 3.4.0版本发布，优化SQLite兼容性

Python环境监控性能监控与调优：专家级技巧全集

simulinlk怎么插入线

Java项目中standard.jar压缩包的处理与使用

《红楼梦》人物统计。编写程序统计《红楼梦》中的前20位出场最多的人物程序输出效果如下：

pychaim用jieba库统计水浒传前五名人物及出场次数按词的次数排序代码加结果

《红楼梦》人物统计，编写程序统计《红楼梦》中前20位出场最多的人物。《红楼梦》文件在附件中将源代码和运行结果截图提交

流量主小程序多功能工具箱小程序源码-操作简单实用.zip