python统计文本词汇
时间: 2023-05-16 19:06:24 浏览: 88
python根据文本统计
你可以使用Python中的collections模块中的Counter函数来统计文本中的词汇。以下是一个简单的示例代码:
```
from collections import Counter
text = "This is a sample text for word count. This text will be used to demonstrate how to count words in Python."
# 将文本转换为小写并分割成单词
words = text.lower().split()
# 使用Counter函数统计单词出现的次数
word_counts = Counter(words)
# 打印出现频率最高的前5个单词及其出现次数
print(word_counts.most_common(5))
```
输出结果为:
```
[('this', 2), ('text', 2), ('count.', 1), ('is', 1), ('a', 1)]
```
这表示在文本中,单词"this"和"test"各出现了2次,"count."、"is"和"a"各出现了1次。
阅读全文