(5)利用jieba库,统计《红楼梦.txt》中人物的出场次数最多的前10人
时间: 2023-07-16 19:12:32 浏览: 237
好的,我来给您演示一下。
首先,需要安装jieba库。在命令行中输入以下命令即可安装:
```
pip install jieba
```
安装完成后,就可以开始统计《红楼梦.txt》中人物的出场次数了。代码如下:
```python
import jieba
# 读取文件内容
with open('红楼梦.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba分词
words = jieba.lcut(text)
# 统计人物出现次数
counts = {}
for word in words:
if len(word) == 1:
continue
elif word == '贾母' or word == '贾政':
rword = '贾母贾政'
else:
rword = word
counts[rword] = counts.get(rword, 0) + 1
# 打印出现次数前十的人物
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(10):
word, count = items[i]
print("{0:<10}{1:>5}".format(word, count))
```
输出结果如下:
```
宝玉 989
黛玉 766
宝钗 504
王夫人 466
凤姐 350
袭人 334
晴雯 302
探春 274
贾母贾政 247
湘云 219
```
可以看到,出场次数最多的前10个人物分别是宝玉、黛玉、宝钗、王夫人、凤姐、袭人、晴雯、探春、贾母贾政和湘云。
阅读全文