写一个哈姆雷特词频统计python代码
时间: 2024-02-18 18:37:52 浏览: 71
基于python的词频统计源码
以下是一个简单的哈姆雷特词频统计 Python 代码示例:
```
import string
# 打开文本文件并读取内容
with open('hamlet.txt', 'r') as file:
text = file.read()
# 将文本转换为小写并去除标点符号
text = text.lower().translate(str.maketrans('', '', string.punctuation))
# 将文本拆分为单词列表
words = text.split()
# 创建一个空字典来存储单词计数
word_count = {}
# 遍历单词列表并计数每个单词出现的次数
for word in words:
if word in word_count:
word_count[word] += 1
else:
word_count[word] = 1
# 按单词出现次数从高到低排序并打印结果
for word, count in sorted(word_count.items(), key=lambda x: x[1], reverse=True):
print(f'{word}: {count}')
```
在这个示例代码中,我们首先使用 Python 的 `with` 语句打开并读取了一个名为 `hamlet.txt` 的文本文件。然后,我们将文本转换为小写并去除标点符号,这样可以使单词的计数更加准确。接着,我们使用 `split()` 方法将文本拆分为单词列表,并创建一个空字典来存储单词计数。最后,我们遍历单词列表并对每个单词计数,最终按单词出现次数从高到低排序并打印结果。
阅读全文