python解决中文词语分析红楼梦中贾宝玉出现的次数
时间: 2024-06-08 17:08:58 浏览: 11
要解决这个问题,需要先找到《红楼梦》的文本,然后使用Python对其进行处理。
1. 下载《红楼梦》的文本文件
可以从以下链接下载《红楼梦》的文本文件:
https://github.com/Python3WebSpider/Python3WebSpider/blob/master/Chapter7/corpus/hongloumeng.txt
2. 读取文本文件并进行分词
可以使用Python中的jieba库对文本进行分词。以下是示例代码:
``` python
import jieba
# 读取文本文件
with open('hongloumeng.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 对文本进行分词
words = jieba.lcut(text)
```
3. 统计贾宝玉出现的次数
可以遍历分词结果,统计贾宝玉出现的次数。以下是示例代码:
``` python
# 统计贾宝玉出现的次数
count = 0
for word in words:
if word == '贾宝玉':
count += 1
print('贾宝玉出现的次数为:', count)
```
完整代码如下:
``` python
import jieba
# 读取文本文件
with open('hongloumeng.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 对文本进行分词
words = jieba.lcut(text)
# 统计贾宝玉出现的次数
count = 0
for word in words:
if word == '贾宝玉':
count += 1
print('贾宝玉出现的次数为:', count)
```
运行以上代码,即可输出贾宝玉在《红楼梦》中出现的次数。