python用内置函数进行英文词频统计
时间: 2023-08-04 10:31:31 浏览: 92
用python统计词频脚本
5星 · 资源好评率100%
Python中可以使用collections模块中的Counter类来进行英文词频统计。具体操作如下:
```python
from collections import Counter
# 定义文本字符串
text = "The quick brown fox jumps over the lazy dog. The dog slept over the verandah."
# 将文本字符串转为小写并分割成单词
words = text.lower().split()
# 使用Counter类统计单词出现的频率
word_counts = Counter(words)
# 输出结果
print(word_counts)
```
上述代码中,首先将文本字符串转为小写并分割成单词。然后使用Counter类对单词进行统计,得到每个单词出现的次数。最后输出结果。输出结果如下:
```
Counter({'the': 3, 'over': 2, 'dog.': 1, 'quick': 1, 'brown': 1, 'fox': 1, 'jumps': 1, 'lazy': 1, 'dog': 1, 'slept': 1, 'verandah.': 1})
```
其中,Counter对象是一个字典,键为单词,值为该单词出现的频率。可以通过调用most_common方法,按照出现次数从高到低输出前n个出现频率最高的单词,代码如下:
```python
# 输出出现频率最高的前3个单词
print(word_counts.most_common(3))
```
输出结果如下:
```
[('the', 3), ('over', 2), ('dog.', 1)]
```
以上代码展示了如何使用Python内置函数进行英文词频统计。
阅读全文