Python统计词频
时间: 2024-06-20 20:01:56 浏览: 154
Python编写的词频统计工具
5星 · 资源好评率100%
在Python中,统计词频通常使用内置的`collections`模块中的`Counter`类。`Counter`是一个方便的数据结构,用于计数可哈希对象(如字符串)在列表、元组或其他可迭代对象中的出现次数。以下是一个简单的步骤来统计一个文本中单词的频率:
```python
from collections import Counter
def word_frequency(text):
# 将文本转换为小写并分割成单词列表
words = text.lower().split()
# 使用Counter计算每个单词的频率
frequency = Counter(words)
return frequency
# 示例用法
text = "This is a sample sentence to demonstrate word frequency in Python."
word_freq = word_frequency(text)
# 打印结果
for word, freq in word_freq.most_common(): # .most_common()返回一个按频率降序排列的元组列表
print(f"'{word}': {freq}")
阅读全文