首页hamlet英文词频统计

hamlet英文词频统计

时间: 2023-07-03 13:31:44 浏览: 128

为了进行hamlet英文词频统计，我们可以通过以下步骤来实现： 1. 获取hamlet文本文件。 2. 打开文件并读取文本内容。 3. 将文本内容转换为小写字母，以便统计词频时不区分大小写。 4. 使用正则表达式或字符串函数将文本内容分割为单词列表。 5. 遍历单词列表，统计每个单词出现的次数。 6. 将结果按照出现次数从高到低排序，并输出前N个单词及其出现次数。下面是一个示例代码，可以实现hamlet英文词频统计： ```python import re # 读取hamlet文本文件 with open('hamlet.txt', 'r') as f: text = f.read() # 将文本内容转换为小写字母 text = text.lower() # 使用正则表达式将文本内容分割为单词列表 words = re.findall(r'\b\w+\b', text) # 统计每个单词出现的次数 freq = {} for word in words: if word in freq: freq[word] += 1 else: freq[word] = 1 # 按照出现次数从高到低排序，并输出前N个单词及其出现次数 N = 10 sorted_freq = sorted(freq.items(), key=lambda x: x[1], reverse=True)[:N] for word, count in sorted_freq: print(f'{word}: {count}') ``` 这个示例代码将hamlet文本文件中出现次数最多的前10个单词及其出现次数输出到屏幕上。你可以根据需要调整N的值来输出更多或更少的单词。

阅读全文