Python怎么统计词频
时间: 2023-11-05 21:12:22 浏览: 191
Python可以使用字典(dict)来统计词频,具体实现方法如下:
```python
text = "hello world, hello python, world of python"
word_list = text.lower().split() # 先将文本转换为小写,并分割成单词列表
word_count = {} # 定义空字典用于统计词频
for word in word_list:
if word not in word_count:
word_count[word] = 1
else:
word_count[word] += 1
print(word_count)
```
上述代码中,首先将文本转换为小写,并分割成单词列表。然后遍历列表中的每个单词,将其作为字典的键,如果该键不存在,则将其添加到字典中,并将值设置为1;如果该键已经存在,则将其对应的值加1。最后输出统计结果即可。
相关问题
Python统计词频
在Python中,统计词频通常使用内置的`collections`模块中的`Counter`类。`Counter`是一个方便的数据结构,用于计数可哈希对象(如字符串)在列表、元组或其他可迭代对象中的出现次数。以下是一个简单的步骤来统计一个文本中单词的频率:
```python
from collections import Counter
def word_frequency(text):
# 将文本转换为小写并分割成单词列表
words = text.lower().split()
# 使用Counter计算每个单词的频率
frequency = Counter(words)
return frequency
# 示例用法
text = "This is a sample sentence to demonstrate word frequency in Python."
word_freq = word_frequency(text)
# 打印结果
for word, freq in word_freq.most_common(): # .most_common()返回一个按频率降序排列的元组列表
print(f"'{word}': {freq}")
python统计词频
在Python中,统计词频通常可以使用内置的数据结构如`collections.Counter`或者第三方库如`collections`、`NLTK`、`scikit-learn`等。下面是一个简单的例子,使用`collections.Counter`来统计文本中每个单词出现的次数:
```python
from collections import Counter
def word_frequency(text):
# 将文本转换为小写并分割成单词列表
words = text.lower().split()
# 使用Counter计算每个单词的频率
frequency = Counter(words)
return frequency
# 示例文本
text = "这是一个测试文本,用于演示如何统计词频。"
word_freq = word_frequency(text)
# 打印结果
for word, freq in word_freq.most_common(): # 输出最常见的词和它们的频率
print(f"{word}: {freq}")
阅读全文