python哈姆雷特英文词频统计
时间: 2023-09-01 21:07:40 浏览: 118
基于 python 实现英文文章的词频统计, 并画出词频图
以下是使用Python进行哈姆雷特英文词频统计的示例代码:
```python
# 读取文件
with open('hamlet.txt', 'r') as f:
text = f.read()
# 将文本中的标点符号和换行符替换为空格
text = text.replace('\n', ' ')
text = text.translate(str.maketrans('', '', '!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'))
# 将文本转换为小写
text = text.lower()
# 将文本分割为单词
words = text.split()
# 统计每个单词的出现次数
word_counts = {}
for word in words:
if word in word_counts:
word_counts[word] += 1
else:
word_counts[word] = 1
# 按照出现次数从大到小排序
sorted_word_counts = sorted(word_counts.items(), key=lambda x: x[1], reverse=True)
# 输出前20个出现次数最多的单词
for i in range(20):
print(f'{sorted_word_counts[i][0]}: {sorted_word_counts[i][1]}')
```
注意:需要先将哈姆雷特英文原文保存为名为“hamlet.txt”的文本文件,然后将该文件放在Python文件所在的目录中才能运行上述代码。
阅读全文