编写程序:进行Hamlet英文词频统计
时间: 2023-09-06 07:10:40 浏览: 156
以下是一个简单的 Python 程序,可以用来统计哈姆雷特(Hamlet)的英文词频:
```python
import string
# 打开 Hamlet 文本文件并读取内容
with open('hamlet.txt', 'r') as file:
hamlet = file.read()
# 将文本转换为小写并去除标点符号
hamlet = hamlet.lower()
hamlet = hamlet.translate(str.maketrans('', '', string.punctuation))
# 将文本分割为单词列表
words = hamlet.split()
# 统计每个单词的出现次数
word_counts = {}
for word in words:
if word not in word_counts:
word_counts[word] = 0
word_counts[word] += 1
# 打印出现频率最高的前 10 个单词
for word, count in sorted(word_counts.items(), key=lambda x: x[1], reverse=True)[:10]:
print(word, count)
```
这个程序首先打开 Hamlet 文本文件并读取其内容。然后将文本转换为小写,并使用 Python 的 `string` 模块中的 `punctuation` 常量去除标点符号。接着将文本分割为单词列表,并遍历列表统计每个单词的出现次数。最后,使用 Python 的 `sorted` 函数将单词按照出现次数进行排序,并打印出现频率最高的前 10 个单词。
阅读全文