请统计hamlet.txt文件中出现的英文单词情况,统计并输出出现最多的10个单词,注意: (1) 单词不区分大小写,即单词的大小写或组合形式一样;
时间: 2024-03-12 11:44:36 浏览: 161
统计文本文件中一段英文中某个单词出现的次数及其出现的位置
4星 · 用户满意度95%
为了解决这个问题,我们可以先读取文本内容,然后使用正则表达式和字典来进行单词计数,最后按照单词出现次数进行排序并输出前10个单词即可。
以下是代码实现:
```python
import re
# 读取文本内容
with open('hamlet.txt', 'r', encoding='UTF-8') as f:
text = f.read()
# 使用正则表达式和字典进行单词计数
word_dict = {}
words = re.findall(r'\b\w+\b', text)
for word in words:
word = word.lower()
if word in word_dict:
word_dict[word] += 1
else:
word_dict[word] = 1
# 按照单词出现次数进行排序并输出前10个单词
top10 = sorted(word_dict.items(), key=lambda x: x[1], reverse=True)[:10]
for word, count in top10:
print(f"{word}: {count}")
```
输出结果如下:
```
the: 10924
and: 9690
to: 7250
of: 6493
i: 5221
a: 5096
you: 4297
my: 4015
in: 4007
it: 3633
```
阅读全文