python西游记人物出场统计
时间: 2023-07-01 19:20:13 浏览: 352
好的,以下是Python版《西游记》人物出场统计代码:
```python
import re
# 读取文本内容
with open('xiyouji.txt', 'r', encoding='utf-8') as f:
content = f.read()
# 通过正则表达式匹配出所有人物出现的位置
pattern = re.compile(r'[\u4e00-\u9fa5]{2,5}(?:\·[\u4e00-\u9fa5]{2,5})*')
matches = pattern.findall(content)
# 统计每个人物出现的次数
char_count = {}
for match in matches:
if match in char_count:
char_count[match] += 1
else:
char_count[match] = 1
# 按照出场次数从高到低排序
sorted_chars = sorted(char_count.items(), key=lambda x: x[1], reverse=True)
# 输出前20个人物及其出场次数
for i in range(20):
print(sorted_chars[i][0], sorted_chars[i][1])
```
以上代码会读取名为 `xiyouji.txt` 的文本文件,通过正则表达式匹配出所有人物出现的位置,并统计每个人物出现的次数。最后按照出场次数从高到低排序并输出前20个人物及其出场次数。
需要注意的是,该代码仅适用于文本内容为简体中文的情况。如果需要处理繁体中文或其他语言的文本内容,需要对正则表达式进行相应修改。
阅读全文