pychaim用jieba库统计水浒传前五名人物及出场次数 按词的次数排序 代码加结果
时间: 2024-10-26 16:16:15 浏览: 185
在Python中,使用`pycharmjieba`配合jieba库统计《水浒传》中前五名人物及其出场次数并按词频排序,你需要先提取出人物名称,然后进行计数和排序。以下是一个简单的步骤示例,假设你已经有了文本数据,并且已经分词为`word_list`:
```python
import jieba
from collections import Counter
# 假设word_list是从《水浒传》文本中获取的分词列表,其中包含了人物名字
word_list = ... # 需要实际替换为你的分词结果
# 提取可能的人物名称,这里仅作为示例,实际需要根据《水浒传》的内容确定
characters = ['宋江', '林冲', '鲁智深', '武松', '吴用'] # 可能的人物列表
# 创建一个Counter来统计每个字符的出现次数
character_counter = Counter([word for word in word_list if word in characters])
# 按照出现次数降序排序
sorted_characters = sorted(character_counter.items(), key=lambda x: x[1], reverse=True)
# 输出前五名人物及其出场次数
for i in range(5):
character, count = sorted_characters[i]
print(f"{i+1}. {character}: {count}次")
```
请注意,这只是一个简化版本,实际操作中可能需要更复杂的正则表达式匹配或者从原始文本中自动抽取人物名称。同时,分词后的结果还需要经过清理,去除停用词和标点符号,以便更准确地识别人物名称。
阅读全文