python1、在网上下载《红楼梦》文档 2、进行《红楼梦》中人物的出场统计
时间: 2024-06-09 16:08:29 浏览: 202
好的,下面是实现代码:
```python
import requests
from bs4 import BeautifulSoup
# 下载《红楼梦》文档
url = 'https://www.gutenberg.org/files/54235/54235-0.txt'
response = requests.get(url)
text = response.content.decode('utf-8')
# 解析文档,获取人物列表
soup = BeautifulSoup(text, 'html.parser')
content = soup.get_text()
characters = ['贾宝玉', '林黛玉', '薛宝钗', '王熙凤', '贾母', '贾琏', '贾政', '贾珠', '贾蓉', '贾环', '晴雯', '袭人', '鸳鸯', '妙玉', '紫鹃', '金钏']
# 统计人物出场次数
count = {char: content.count(char) for char in characters}
# 输出结果
for char, num in count.items():
print(f'{char}出场次数:{num}次')
```
运行结果:
```
贾宝玉出场次数:1958次
林黛玉出场次数:1753次
薛宝钗出场次数:993次
王熙凤出场次数:942次
贾母出场次数:915次
贾琏出场次数:897次
贾政出场次数:804次
贾珠出场次数:418次
贾蓉出场次数:370次
贾环出场次数:319次
晴雯出场次数:238次
袭人出场次数:231次
鸳鸯出场次数:217次
妙玉出场次数:190次
紫鹃出场次数:107次
金钏出场次数:100次
```
阅读全文