python统计西游记人物名字出现次数_Python文本统计功能之西游记用字统计操作示例...
时间: 2024-03-18 07:41:33 浏览: 79
好的,您的问题是关于Python统计《西游记》人物名字出现次数的操作示例。以下是一个简单的实现:
```python
import re
# 读取《西游记》文本
with open('xiyouji.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用正则表达式匹配人物名字
pattern = re.compile('[\u4e00-\u9fa5]{2,4}(?:·[\u4e00-\u9fa5]{2,4})*')
names = pattern.findall(text)
# 统计人物名字出现次数
name_count = {}
for name in names:
if name not in name_count:
name_count[name] = 1
else:
name_count[name] += 1
# 输出出现次数前20的人物名字
sorted_name_count = sorted(name_count.items(), key=lambda x: x[1], reverse=True)
for i in range(20):
print(f'{i+1}. {sorted_name_count[i][0]}: {sorted_name_count[i][1]}')
```
注意,这里使用了正则表达式来匹配人物名字,因为人物名字可能包含多个汉字以及“·”符号。如果您使用的文本格式不同,可能需要修改正则表达式的匹配规则。同时,由于《西游记》中存在很多同名人物,如“孙悟空”和“孙猴子”,因此统计结果可能存在一定的误差。
阅读全文