利用python去统计一个txt的英文文档,里面包含哪些单词,各个单词出现的频率如何
时间: 2024-05-08 13:20:07 浏览: 102
python实现统计文本中单词出现的频率详解
您可以使用Python中的collections库中的Counter类来统计一个txt文件中各单词出现的频率。Counter类可以对列表中的元素进行计数,并返回一个字典,其中键是元素,值是该元素在列表中出现的次数。
以下是一个示例代码,用于统计名为"sample.txt"的英文文档中出现的各个单词及其频率:
```python
from collections import Counter
with open("sample.txt") as file:
word_counts = Counter(file.read().lower().split())
for word, count in word_counts.most_common():
print(f"{word}: {count}")
```
这个代码块将打印出各个单词及它们在文档中出现的频率,按照频率从高到低排序。请注意,这个代码块将文件中的所有单词转换为小写字母,以确保相同的单词不会被计算为不同的单词。
阅读全文