用python进行词频分析
时间: 2023-05-21 14:05:58 浏览: 113
Python之词频统计
可以使用Python中的nltk库或者jieba库来进行词频分析。nltk可以处理英文文本,而jieba可以处理中文文本。下面是使用jieba库进行中文文本的词频分析的示例代码:
```python
import jieba
from collections import Counter
# 读取文件
with open('content.txt', 'r', encoding='utf-8') as f:
content = f.read()
# 使用jieba库进行分词
words = list(jieba.cut(content))
# 统计词频
word_counts = Counter(words)
# 打印出现频率前10的词汇
for word, count in word_counts.most_common(10):
print('{}: {}'.format(word, count))
```
其中,'content.txt'是需要进行词频分析的文件的文件名,可以根据实际情况进行修改。
阅读全文