python当考生目录中有中文电子版的《红楼梦》小说txt的文件，利用jieba库，编程统计两部小说中人物出场的次数，并排除“什么”，“一个”，“我们”，“你们”，“起来”，“这里”，“出来”，“那里”，“怎么”，“不是”，“只见”，“没有”，“知道”，“两个”，“一面”，“如今”，“自己”，“说道”18个词，输出人物出场次数的前十名，去掉分词中一个字的。‘’‘

时间: 2023-09-07 18:13:32 浏览: 237

好的，我来给您写一个代码。首先需要安装jieba库，可以使用以下命令进行安装： ``` pip install jieba ``` 接下来是代码实现： ```python import jieba # 读取《红楼梦》文本 with open('红楼梦.txt', 'r', encoding='utf-8') as f: text = f.read() # 停用词 stop_words = ['什么', '一个', '我们', '你们', '起来', '这里', '出来', '那里', '怎么', '不是', '只见', '没有', '知道', '两个', '一面', '如今', '自己', '说道'] # 分词 words = jieba.lcut(text) word_counts = {} # 统计词频 for word in words: if len(word) > 1 and word not in stop_words: word_counts[word] = word_counts.get(word, 0) + 1 # 读取考生目录中的文本 with open('考生目录/另一部小说.txt', 'r', encoding='utf-8') as f: text2 = f.read() # 分词 words2 = jieba.lcut(text2) word_counts2 = {} # 统计词频 for word in words2: if len(word) > 1 and word not in stop_words: word_counts2[word] = word_counts2.get(word, 0) + 1 # 合并人物出现次数 characters_counts = {} for word_count in [word_counts, word_counts2]: for word, count in word_count.items(): if word in characters_counts: characters_counts[word] += count else: characters_counts[word] = count # 输出人物出现次数的前十名 characters_counts = sorted(characters_counts.items(), key=lambda x: x[1], reverse=True) for i in range(10): print(characters_counts[i]) ``` 需要将代码中的红楼梦文本替换为考生目录中的《红楼梦》小说txt文件名，另一部小说也一样。另外，需要保证两个文本文件编码方式为utf-8。该代码使用了jieba库进行中文分词和统计词频，同时排除了停用词和单个汉字。最后输出人物出现次数的前十名。

阅读全文

相关推荐

使用Python和jieba库进行红楼梦人物统计与密码生成

利用Python和jieba库高效去除文本中的停用词

Python利用jieba进行中文分词与词频统计

(5)利用jieba库，统计《红楼梦.txt》中人物的出场次数最多的前10人

python用jieba库统计红楼梦中贾宝玉名字出现的次数

如何用python ，利用中文分词jieba库，统计一篇txt中文文章中出现频率最高的10个中文词。

使用jieba库统计红楼梦中人物

用python语言利用jieba库分析文本，并利用wordcloud库生成一个txt文件的词云

利用jieba库分析统计出三国演义中出现次数排前20的中文词语(长度为1的词不统计） 统计结果写入文本文件result.txt中

创建一个中文内容的文本文件，用Python中jieba库，进行中文词频统计

python中jieba库

对商城评价文件利用jieba库进行词频统计,分析用户评价信息

pythonjieba库

对商城评价文件利用jieba库进行词频统计,分析用户评价信息。

利用jieba库 wordcloud词频统计

用python写出 红楼梦出场角色前十五名用到jieba库

jieba python库

Python中文分词库jieba3k 0.32版本发布

Python编程：jieba分词库在金融工程中的应用

最新推荐

python使用jieba实现中文分词去停用词方法示例

python实现统计文本中单词出现的频率详解

Python中文分词工具之结巴分词用法实例总结【经典案例】

Python中快速友好的MessagePack序列化库msgspec

管理建模和仿真的文件

STM32 HAL库函数手册精读：最佳实践与案例分析

如何利用FineReport提供的预览模式来优化报表设计，并确保最终用户获得最佳的交互体验？

大学生社团管理系统设计与实现

"互动学习：行动中的多样性与论文攻读经历"

STM32 HAL库深度解析：新手到高手的进阶之路

利用jieba库分析统计出三国演义中出现次数排前20的中文词语(长度为1的词不统计）统计结果写入文本文件result.txt中

用python写出红楼梦出场角色前十五名用到jieba库