一本英文书,怎么统计出现频率最高的10个单词
时间: 2023-06-10 10:02:58 浏览: 300
要统计一本英文书中出现频率最高的10个单词,可以按照以下步骤进行:
1. 首先,将书的文本内容读入程序中,可以使用Python中的open()函数打开文件并读取内容。
2. 对文本内容进行预处理,包括去掉标点符号、转换成小写等。
3. 将文本内容分割成单词,可以使用Python中的split()函数。
4. 统计每个单词在文本中出现的次数,可以使用Python中的字典来实现。遍历文本中每个单词,将其作为字典的键,如果该键不存在,则添加键值对,值为1;如果该键存在,则将对应的值加1。
5. 对字典按值进行排序,可以使用Python中的sorted()函数,设置按值降序排序。
6. 输出出现频率最高的10个单词,可以遍历排序后的字典,输出前10个键即可。
下面是Python代码示例:
```python
import string
# 读取文本内容
with open('book.txt', 'r') as f:
text = f.read()
# 预处理文本内容
text = text.translate(str.maketrans('', '', string.punctuation))
text = text.lower()
# 分割文本内容成单词列表
words = text.split()
# 统计每个单词出现的次数
freq_dict = {}
for word in words:
if word not in freq_dict:
freq_dict[word] = 1
else:
freq_dict[word] += 1
# 按值降序排序字典
sorted_dict = dict(sorted(freq_dict.items(), key=lambda x: x[1], reverse=True))
# 输出出现频率最高的10个单词
for word, freq in sorted_dict.items():
print(word, freq)
if len(sorted_dict) == 10:
break
```
阅读全文