hamlet英文词频统计
时间: 2023-07-03 08:31:44 浏览: 108
8-2 词频统计之《哈姆雷特》
为了进行hamlet英文词频统计,我们可以通过以下步骤来实现:
1. 获取hamlet文本文件。
2. 打开文件并读取文本内容。
3. 将文本内容转换为小写字母,以便统计词频时不区分大小写。
4. 使用正则表达式或字符串函数将文本内容分割为单词列表。
5. 遍历单词列表,统计每个单词出现的次数。
6. 将结果按照出现次数从高到低排序,并输出前N个单词及其出现次数。
下面是一个示例代码,可以实现hamlet英文词频统计:
```python
import re
# 读取hamlet文本文件
with open('hamlet.txt', 'r') as f:
text = f.read()
# 将文本内容转换为小写字母
text = text.lower()
# 使用正则表达式将文本内容分割为单词列表
words = re.findall(r'\b\w+\b', text)
# 统计每个单词出现的次数
freq = {}
for word in words:
if word in freq:
freq[word] += 1
else:
freq[word] = 1
# 按照出现次数从高到低排序,并输出前N个单词及其出现次数
N = 10
sorted_freq = sorted(freq.items(), key=lambda x: x[1], reverse=True)[:N]
for word, count in sorted_freq:
print(f'{word}: {count}')
```
这个示例代码将hamlet文本文件中出现次数最多的前10个单词及其出现次数输出到屏幕上。你可以根据需要调整N的值来输出更多或更少的单词。
阅读全文