Python西游记人物出场统计
时间: 2023-10-30 14:05:06 浏览: 831
Python 西游记人物出场统计可以通过文本分析和数据处理来实现。以下是一种可能的方法:
1. 获取《西游记》的文本数据,可以从网络上下载或者通过网络爬虫获取。
2. 使用 Python 中的正则表达式或其他文本处理库,将文本数据中的人物名字提取出来,并存储到一个列表中。
3. 遍历列表,使用 Python 中的字典数据结构来统计每个人物出场的次数。
4. 对字典按照出场次数进行排序,输出排名前几的人物以及他们的出场次数。
以下是一个简单的代码示例:
```python
import re
# 读取文本文件
with open('journey_to_the_west.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用正则表达式提取人物名字
pattern = re.compile('[\u4e00-\u9fa5]{2,4}(?:·[\u4e00-\u9fa5]{2,4})*')
names = re.findall(pattern, text)
# 统计人物出现次数
name_dict = {}
for name in names:
if name in name_dict:
name_dict[name] += 1
else:
name_dict[name] = 1
# 按照出场次数排序
sorted_names = sorted(name_dict.items(), key=lambda x: x[1], reverse=True)
# 输出前10个人物及出场次数
for name, count in sorted_names[:10]:
print(name, count)
```
需要注意的是,这个代码示例只是一个简单的实现,对于一些复杂的情况,例如人物名字有别名或者同名等,需要进行更加细致的处理。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)