从https://www.chinadaily.com.cn/下载一则新闻,保存到txt文件中,读取该文件,并统计每个单词在新闻中出现的次数。
时间: 2024-03-15 09:41:53 浏览: 56
好的,我明白了。以下是对应的Python代码:
```python
import requests
from collections import Counter
# 下载新闻并保存到txt文件中
url = 'https://www.chinadaily.com.cn/a/202202/17/WS621a2e7fa3101c14c6f6f5ee.html'
response = requests.get(url)
with open('news.txt', 'w', encoding='utf-8') as f:
f.write(response.text)
# 读取txt文件并统计每个单词出现的次数
with open('news.txt', 'r', encoding='utf-8') as f:
text = f.read().lower() # 转换为小写字母,方便统计
# 进行单词计数
words = text.split()
word_count = Counter(words)
# 输出前10个出现次数最多的单词
for word, count in word_count.most_common(10):
print(word, count)
```
其中,我们使用了第三方库requests来下载新闻,并使用collections库中的Counter类来进行单词计数。最后,我们输出出现次数最多的前10个单词。
阅读全文