在python中请用jieba完成统计三国演义人物的出场次数
时间: 2023-06-11 08:04:45 浏览: 282
好的,我会按照你的要求进行回答。为了完成该任务,你需要首先安装jieba库。你可以使用以下命令进行安装:
```
pip install jieba
```
然后,你需要获取三国演义的原始文本数据,并将其放入到一个文本文件中,比如"sgyy.txt"。接下来,你可以使用以下代码进行统计人物出场次数:
```python
import jieba
# 读取文件内容
with open('sgyy.txt', 'r', encoding='utf-8') as f:
sgyy = f.read()
# 使用jieba分词
words = jieba.lcut(sgyy)
# 统计人物出现次数
counts = {}
for word in words:
if len(word) == 1: # 过滤掉单个字的词语
continue
elif word == '诸葛亮' or word == '孔明曰': # 同一人物,不同称呼,视为一个
rword = '孔明'
elif word == '关公' or word == '云长':
rword = '关羽'
elif word == '玄德' or word == '刘皇叔' or word == '刘备曰':
rword = '刘备'
elif word == '孟德' or word == '曹贼':
rword = '曹操'
else:
rword = word
counts[rword] = counts.get(rword, 0) + 1
# 输出结果
for word in sorted(counts, key=lambda x: counts[x], reverse=True):
print(f'{word}\t{counts[word]}')
```
运行以上代码,你就可以得到统计结果了。注意,由于jieba分词并不是完全准确的,因此统计结果也可能存在一些误差,需要根据具体情况进行调整。
阅读全文