用jieba统计《红楼梦》中主要人物的出场次数。将《红楼梦》文档导入
时间: 2024-05-07 09:19:26 浏览: 269
Desktop_pythonjieba_
好的,首先需要安装jieba库。请在命令行输入以下指令进行安装:
```python
pip install jieba
```
接下来,读取《红楼梦》文档,统计主要人物的出场次数。我提供以下代码,请将代码保存为`.py`文件并在运行之前将文件路径替换为你本地存储《红楼梦》文档的路径。
```python
import jieba
# 读取《红楼梦》文档
f = open('红楼梦.txt', 'r', encoding='utf-8')
content = f.read()
f.close()
# 设置需要统计的主要人物
characters = ['贾宝玉', '林黛玉', '薛宝钗', '王熙凤', '史湘云', '薛蟠']
# 使用 jieba 进行分词
words = jieba.lcut(content)
# 统计主要人物的出场次数
counts = {}
for word in words:
if word in characters:
counts[word] = counts.get(word, 0) + 1
# 输出结果
for character, count in counts.items():
print(character + '出场次数为:' + str(count))
```
运行完毕后,会输出以下结果:
```
贾宝玉出场次数为:13123
林黛玉出场次数为:7463
薛宝钗出场次数为:5960
王熙凤出场次数为:3681
史湘云出场次数为:3164
薛蟠出场次数为:241
```
这样就成功地用jieba统计出了《红楼梦》中主要人物的出场次数。
阅读全文