使用requests库抓取电脑中《西游记》文件中的高频词包括:“孙悟空”“猪八戒”“沙僧”“唐僧”和“小白龙”师徒五人的词汇。
时间: 2023-10-27 08:06:10 浏览: 191
Python中的Requests库:简化HTTP请求的强大工具
好的,您可以使用以下代码来完成这个任务:
```python
import re
import requests
url = "file:///C:/path/to/your/westernjourney.txt"
response = requests.get(url)
text = response.text
# 使用正则表达式匹配师徒五人的名字
pattern = r"孙悟空|猪八戒|沙僧|唐僧|小白龙"
names = re.findall(pattern, text)
# 统计词频
freq = {}
for name in names:
freq[name] = freq.get(name, 0) + 1
# 输出词频结果
for name, count in freq.items():
print(f"{name}: {count}")
```
请将 `C:/path/to/your/westernjourney.txt` 替换成您电脑中《西游记》文件的路径。这段代码可以从指定路径读取文本文件内容,并使用正则表达式找到师徒五人的名字,然后统计它们在文本中出现的次数,并输出词频结果。
阅读全文