python123用字典来统计词频
时间: 2024-12-23 07:25:47 浏览: 21
Python的字典非常适合用于统计词频,因为它允许我们通过键值对的方式来存储数据。假设我们有一个字符串列表,包含了一些文本,我们可以按照以下步骤来统计每个单词的频率:
```python
# 创建一个空字典来存放词频
word_freq = {}
# 假设text_list是一个包含文本的列表
for text in text_list:
# 将文本分割成单词列表,这里通常使用split()函数,如果需要考虑标点符号,可以先用正则表达式预处理
words = text.split()
# 遍历单词列表
for word in words:
# 如果单词已经在字典中,则将其计数加一;如果不在,添加新键并设置计数为1
if word in word_freq:
word_freq[word] += 1
else:
word_freq[word] = 1
# 现在word_freq字典中包含了每个单词及其出现次数
```
最后,你可以打印出整个字典,查看每个单词的词频。如果你想要找出最常见的几个单词,还可以使用`most_common()`函数。
相关问题
python123词频统计V1
好的,我了解了你的要求。针对你的问题,我可以提供以下思路:
1. 首先读取文本文件,可以使用Python内置的open函数打开文件,然后使用read方法读取文件内容。
2. 将读取到的文本内容进行分词,可以使用Python中的jieba库进行中文分词。
3. 统计每个词出现的次数,可以使用Python中的字典进行统计。
4. 将统计结果按照词频从高到低排序,可以使用Python中的sorted函数进行排序。
阅读全文