四大名著人物统计python
时间: 2023-06-28 11:05:59 浏览: 223
openkg四大名著人物关系数据集.zip
以下是使用Python统计四大名著人物出现次数的示例代码:
```python
import jieba
# 读取文本文件
with open('journey_to_the_west.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba分词进行中文分词
words = jieba.lcut(text)
# 统计人物出现次数
counts = {}
for i in range(len(words)-1):
if words[i] == '孙悟空' or words[i] == '唐僧' or words[i] == '猪八戒' or words[i] == '沙和尚':
if words[i+1] != ',' and words[i+1] != '。' and words[i+1] != '!' and words[i+1] != '?':
name = words[i]
counts[name] = counts.get(name, 0) + 1
# 输出结果
for name in counts:
print(name, counts[name])
```
在这个示例代码中,我们首先使用`jieba`进行中文分词,然后遍历分词结果,统计人物出现次数。四大名著中的主要人物包括孙悟空、唐僧、猪八戒和沙和尚,因此我们在遍历过程中判断每个词语是否为其中一个人物的名字,如果是,就将其后面的词语作为该人物的出现场景,统计出现次数。最后输出结果,得到每个人物的出现次数。
阅读全文