3.《哈姆雷特》是莎士比亚的一部经典悲剧作品。请编写程序统计hamlet.txt 中出现频率最 高的前10个单词,并将结果用文件名"hamlet 词频txt”保存在同目录下。中
时间: 2023-06-14 16:06:51 浏览: 139
8-2 词频统计之《哈姆雷特》
以下是 Python 代码实现:
```python
# 打开文件并读取文本内容
with open('hamlet.txt', 'r') as f:
text = f.read()
# 将文本转换为小写并分割成单词列表
words = text.lower().split()
# 统计每个单词的出现次数
word_count = {}
for word in words:
if word not in word_count:
word_count[word] = 1
else:
word_count[word] += 1
# 按照单词出现次数排序,取出前10个单词
top_words = sorted(word_count.items(), key=lambda x:x[1], reverse=True)[:10]
# 将结果保存到文件
with open('hamlet词频.txt', 'w') as f:
for word, count in top_words:
f.write(f'{word}: {count}\n')
```
注意,这里只是简单地将文本按照空格分割成单词,因此可能存在一些标点符号或特殊字符被误认为是单词的情况。如果需要更精确的处理,可以使用正则表达式或其他文本处理工具。
阅读全文