写一个利用文本分词去计算出词频的程序
时间: 2023-09-20 13:09:08 浏览: 51
基于Python实现分析文本数据的词频
好的,下面是一个简单的程序:
```python
import jieba
# 读取文本文件
with open("text.txt", "r", encoding="utf-8") as f:
text = f.read()
# 分词
words = jieba.cut(text)
# 统计词频
word_freq = {}
for word in words:
if word not in word_freq:
word_freq[word] = 1
else:
word_freq[word] += 1
# 输出词频结果
for word, freq in word_freq.items():
print(word, freq)
```
其中,`text.txt`是要分析的文本文件,需要放在程序所在的目录下。程序首先使用`jieba.cut()`函数对文本进行分词,然后统计每个词语出现的次数,最后输出词频结果。可以根据具体情况对输出结果进行格式化等处理。
阅读全文