python词频统计并排序
时间: 2024-10-13 07:15:21 浏览: 31
在Python中,你可以使用collections模块下的Counter类来进行词频统计,并结合内置的sorted函数对结果进行排序。以下是基本步骤:
```python
from collections import Counter
def word_frequency(text):
# 将文本转换为小写并分割成单词列表
words = text.lower().split()
# 使用Counter计算每个单词的频率
frequency = Counter(words)
# 按照频率降序排列单词及其频率
sorted_frequency = sorted(frequency.items(), key=lambda x: x[1], reverse=True)
return sorted_frequency
# 示例
text = "This is a sample text for word frequency analysis. This will show how often each word appears."
result = word_frequency(text)
print("Word Frequency (most common first):")
for word, freq in result:
print(f"{word}: {freq}")
```
在这个例子中,`sorted_frequency`将是一个元组列表,每个元组包含一个单词和其对应的频率。如果你想得到仅包含单词和频率的新字典,可以稍微修改一下返回的结果。
阅读全文