Hamlet英文词频统计
时间: 2023-07-03 16:10:56 浏览: 103
Hamlet是莎士比亚的经典剧目之一,我们可以通过Python来实现对其英文词频的统计。具体实现过程如下:
```python
import string
# 读取文件内容
with open('hamlet.txt', 'r', encoding='utf-8') as f:
content = f.read()
# 将所有单词转换为小写,并去除标点符号
content = content.lower()
content = content.translate(str.maketrans('', '', string.punctuation))
# 将字符串分割为单词列表
words = content.split()
# 统计每个单词出现的次数
word_counts = {}
for word in words:
if word in word_counts:
word_counts[word] += 1
else:
word_counts[word] = 1
# 按照单词出现次数从大到小排序
sorted_word_counts = sorted(word_counts.items(), key=lambda x: x[1], reverse=True)
# 输出前20个出现次数最多的单词
for word, count in sorted_word_counts[:20]:
print(word, count)
```
在上述代码中,我们首先读取了Hamlet文本文件的内容,并将其转换为小写,并去除标点符号。接着,我们将字符串分割为单词列表,并使用字典统计每个单词出现的次数。最后,我们对单词出现次数进行排序,并输出前20个出现次数最多的单词。
阅读全文