帮我写个文本词频统计代码
时间: 2023-09-18 19:06:12 浏览: 62
### 回答1:
吧
嗯,这样吧:
# 导入必要的库
import collections
# 读取文本
with open("text.txt") as f:
text = f.read()
# 统计词频
words = text.split()
counter = collections.Counter(words)
# 打印统计结果
for word, count in counter.most_common():
print(word, count)
### 回答2:
当然可以帮你写一个文本词频统计的代码。下面是一个简单的Python代码示例:
```python
def word_freq(text):
words = text.split() # 将文本拆分成单词列表
freq = {} # 用字典存储每个单词的频率
for word in words:
if word in freq:
freq[word] += 1
else:
freq[word] = 1
return freq
text = input("请输入文本:")
result = word_freq(text)
print("词频统计结果:")
for word, freq in result.items():
print(f"{word}: {freq}")
```
这个代码定义了一个`word_freq`函数,它接受一个字符串类型的文本作为参数,并返回一个字典,其中包含了每个单词及其对应的词频。
代码首先使用`split`方法将文本拆分成单词列表。然后通过遍历单词列表,对每个单词进行词频统计。使用字典`freq`来存储每个单词的频率,如果某个单词已经在字典中存在,就将其频率加1;如果不存在,就将其初始频率设为1。
最后,打印出词频统计的结果,遍历字典中的每个键值对,输出对应的单词及其频率。
你只需运行这段代码并输入你想要进行词频统计的文本,它会给出每个单词的词频统计结果。