Hamlet英文词频统计 python代码
时间: 2023-07-02 16:06:29 浏览: 73
以下是一个简单的Python程序,用于读取Hamlet英文文本文件并统计单词出现的频率:
```python
from collections import Counter
# 读取文件
with open('hamlet.txt', 'r') as f:
text = f.read()
# 将文本转换为小写,并按照空格分割单词
words = text.lower().split()
# 统计单词出现的频率
word_count = Counter(words)
# 打印前10个出现频率最高的单词及其出现次数
for word, count in word_count.most_common(10):
print(word, count)
```
注意:在运行此程序之前,需要将Hamlet文本文件保存为hamlet.txt,并将其放在与程序相同的目录下。
相关问题
hamlet英文词频统计
为了进行hamlet英文词频统计,我们可以通过以下步骤来实现:
1. 获取hamlet文本文件。
2. 打开文件并读取文本内容。
3. 将文本内容转换为小写字母,以便统计词频时不区分大小写。
4. 使用正则表达式或字符串函数将文本内容分割为单词列表。
5. 遍历单词列表,统计每个单词出现的次数。
6. 将结果按照出现次数从高到低排序,并输出前N个单词及其出现次数。
下面是一个示例代码,可以实现hamlet英文词频统计:
```python
import re
# 读取hamlet文本文件
with open('hamlet.txt', 'r') as f:
text = f.read()
# 将文本内容转换为小写字母
text = text.lower()
# 使用正则表达式将文本内容分割为单词列表
words = re.findall(r'\b\w+\b', text)
# 统计每个单词出现的次数
freq = {}
for word in words:
if word in freq:
freq[word] += 1
else:
freq[word] = 1
# 按照出现次数从高到低排序,并输出前N个单词及其出现次数
N = 10
sorted_freq = sorted(freq.items(), key=lambda x: x[1], reverse=True)[:N]
for word, count in sorted_freq:
print(f'{word}: {count}')
```
这个示例代码将hamlet文本文件中出现次数最多的前10个单词及其出现次数输出到屏幕上。你可以根据需要调整N的值来输出更多或更少的单词。
写一个哈姆雷特词频统计python代码
以下是一个简单的哈姆雷特词频统计 Python 代码示例:
```
import string
# 打开文本文件并读取内容
with open('hamlet.txt', 'r') as file:
text = file.read()
# 将文本转换为小写并去除标点符号
text = text.lower().translate(str.maketrans('', '', string.punctuation))
# 将文本拆分为单词列表
words = text.split()
# 创建一个空字典来存储单词计数
word_count = {}
# 遍历单词列表并计数每个单词出现的次数
for word in words:
if word in word_count:
word_count[word] += 1
else:
word_count[word] = 1
# 按单词出现次数从高到低排序并打印结果
for word, count in sorted(word_count.items(), key=lambda x: x[1], reverse=True):
print(f'{word}: {count}')
```
在这个示例代码中,我们首先使用 Python 的 `with` 语句打开并读取了一个名为 `hamlet.txt` 的文本文件。然后,我们将文本转换为小写并去除标点符号,这样可以使单词的计数更加准确。接着,我们使用 `split()` 方法将文本拆分为单词列表,并创建一个空字典来存储单词计数。最后,我们遍历单词列表并对每个单词计数,最终按单词出现次数从高到低排序并打印结果。