用Python实现hamlet的词频统计
时间: 2024-03-02 17:50:09 浏览: 76
python学习文本词频统计hamlet三国演义
好的,以下是用Python实现hamlet的词频统计的代码:
```python
with open('hamlet.txt', 'r') as f:
# 读取文件内容
data = f.read()
# 将所有单词转换为小写,并且将标点符号替换为空格
data = data.lower().replace(',', ' ').replace('.', ' ').replace(';', ' ').replace('?', ' ').replace('!', ' ')
# 将字符串按照空格分割为单词列表
words = data.split()
# 统计每个单词的出现次数
word_count = {}
for word in words:
if word not in word_count:
word_count[word] = 1
else:
word_count[word] += 1
# 按照出现次数从大到小排序
sorted_word_count = sorted(word_count.items(), key=lambda x: x[1], reverse=True)
# 输出前20个单词及其出现次数
for word, count in sorted_word_count[:20]:
print(word, count)
```
其中,'hamlet.txt' 是要统计词频的文件名,可以根据实际情况进行修改。
阅读全文