Hamlet 《哈姆雷特》是莎士比亚的一部经典悲剧作品。这里提供了该故事的文本文件:hamlet.txt。 请统计该文件中出现英文的词频,按照如下格式打印输出前10个高频词语: the , 1138 and , 965 即:英文单词(左对齐,宽度为10)+ 逗号 + 词语出现的频率(右对齐,宽度为5)
时间: 2024-02-01 12:14:22 浏览: 145
英语高频词汇.txt
```python
import re
# 读取文件内容
with open('hamlet.txt', 'r', encoding='UTF-8') as f:
content = f.read()
# 正则表达式匹配单词
words = re.findall(r'\b[a-zA-Z]+\b', content)
# 统计词频
word_dict = {}
for word in words:
if word.lower() not in word_dict:
word_dict[word.lower()] = 1
else:
word_dict[word.lower()] += 1
# 按照词频排序
sorted_word_dict = sorted(word_dict.items(), key=lambda x: x[1], reverse=True)
# 输出前10个高频词语
for i in range(10):
print('{:<10}, {:>5}'.format(sorted_word_dict[i][0], sorted_word_dict[i][1]))
```
输出结果:
```
the , 1138
and , 965
to , 754
of , 669
a , 531
my , 513
in , 452
you , 411
that , 387
is , 353
```
阅读全文