Python编写程序利用jieba库进行分词，统计出三国演义中三国人物的出现次数

好的，首先需要安装jieba库，可以使用以下命令进行安装： ``` pip install jieba ``` 然后，我们需要读取三国演义的文本文件。假设三国演义的文本文件名为“sgyy.txt”，可以使用以下代码进行读取： ```python with open('sgyy.txt', 'r', encoding='utf-8') as f: sgyy_text = f.read() ``` 接下来，我们需要使用jieba库进行分词。可以使用以下代码： ```python import jieba # 分词 seg_list = jieba.cut(sgyy_text) # 去除停用词 stop_words = ['，', '。', '、', '：', '；', '\n', '之', '也', '而', '乃', '其', '则', '者', '其', '为', '以', '有', '是', '在', '不', '而', '此', '彼'] word_list = [word for word in seg_list if word not in stop_words] ``` 上面的代码中，我们使用了jieba.cut()方法对文本进行分词，并使用列表推导式去除了一些无意义的停用词。接下来，我们需要统计出三国演义中三国人物的出现次数。可以使用以下代码： ```python # 统计人物出现次数 person_dict = {} for i in range(len(word_list)-1): if word_list[i] == '曹操' or word_list[i] == '刘备' or word_list[i] == '孙权': if word_list[i+1] != '，' and word_list[i+1] != '。': if word_list[i] not in person_dict: person_dict[word_list[i]] = 1 else: person_dict[word_list[i]] += 1 # 输出结果 for key, value in person_dict.items(): print(key, value) ``` 上面的代码中，我们使用了一个字典来统计人物出现次数。首先，我们遍历分词后的列表，判断当前词是否是三国人物中的一个（曹操、刘备、孙权）。如果当前词是一个三国人物，我们再判断下一个词是否是标点符号（“，”和“。”），如果不是，则将当前词加入到字典中，并将其出现次数加1。最后，我们将字典中统计出来的结果输出即可。完整代码如下： ```python import jieba # 读取文本 with open('sgyy.txt', 'r', encoding='utf-8') as f: sgyy_text = f.read() # 分词 seg_list = jieba.cut(sgyy_text) # 去除停用词 stop_words = ['，', '。', '、', '：', '；', '\n', '之', '也', '而', '乃', '其', '则', '者', '其', '为', '以', '有', '是', '在', '不', '而', '此', '彼'] word_list = [word for word in seg_list if word not in stop_words] # 统计人物出现次数 person_dict = {} for i in range(len(word_list)-1): if word_list[i] == '曹操' or word_list[i] == '刘备' or word_list[i] == '孙权': if word_list[i+1] != '，' and word_list[i+1] != '。': if word_list[i] not in person_dict: person_dict[word_list[i]] = 1 else: person_dict[word_list[i]] += 1 # 输出结果 for key, value in person_dict.items(): print(key, value) ```

阅读全文

Python编写程序利用jieba库进行分词，统计出三国演义中三国人物的出现次数

相关推荐

利用Python生成三国演义和红楼梦词云图

Python实现三国演义词频分析与词云生成

Python生成《三国演义》词云图教程

使用jieba中文分词库完成《三国演义》人物出场统计。

利用jieba库分析统计出三国演义中出现次数排前20的中文词语(长度为1的词不统计） 统计结果写入文本文件result.txt中

4、 jieba库的分词原理是利用一个中文词库，将待分词的文本与分词词库比对，通过图结构和动态规划方法找到最大概率的词组。利用jieba库统计《三国演义》前60回中的高频词。

在python中请用jieba完成统计三国演义人物的出场次数

编写程序，利用jieba库实现Hamet英文词频统计和《三国演义》人物出场统计。请你统计你想要的字的频率

利用python的词云第三方库Wordcloud，结合jieba的分词功能构建《三国演义》的词云效果

利用Python的词云第三方库Wordcloud，结合jieba的分词功能构建《三国演义》的词云效果。

使用jieba，请编写 python 程序，统计《三国演义》中出场次数排名前20的人物和对应的次数。

使用jieba第三方包对《三国演义》文本进行分词,统计诸葛亮出场的次数

利用jieba分词对三国演义.txt进行分词，除去单个字，统计每个词出现的频率，将频率出现最高的20个词打印出来。

用python编写程序完成《三国演义》人物出场统计。

2)使用Jieba库对《三国演义》进行分词处理,分别统计周瑜、吕布、夏侯惇的出场次数。

python三国演义分词统计

编写python程序对《三国演义》人物出场次数进行中文文本词频统计，输出排序前 5 的人物 以及出场次数。

三国演义数据分析系统源码与资料

大家在看

TwinSAFE EL6900 安全模块基础使用指南（针对TC3.1.4020.0版本）.pdf

南京工业大学Python程序设计语言题库及答案

泊松分布MATLAB代码-RJNS3D_VER_1.1:离散断裂网络建模

Skill.wz_冒险岛079WZ_079skill.wz_冒险岛的_冒险岛Skill.wz_冒险岛服务端_

Multisim里的NPN三极管参数资料大全.docx

最新推荐

自动删除hal库spendsv、svc以及systick中断

世界地图Shapefile文件解析与测试指南

Python环境监控高可用构建：可靠性增强的策略

需要在matlab当中批量导入表格数据的指令

Sqlcipher 3.4.0版本发布，优化SQLite兼容性

Python环境监控性能监控与调优：专家级技巧全集

simulinlk怎么插入线

Java项目中standard.jar压缩包的处理与使用

Python环境监控动态配置：随需应变的维护艺术

怎么在APPDesigner中调用外部函数文件

利用jieba库分析统计出三国演义中出现次数排前20的中文词语(长度为1的词不统计）统计结果写入文本文件result.txt中

编写python程序对《三国演义》人物出场次数进行中文文本词频统计，输出排序前 5 的人物以及出场次数。