python读取文件统计词频
时间: 2023-10-12 15:17:22 浏览: 158
下面是一个简单的 Python 代码,它可以读取一个文本文件并统计每个单词出现的次数:
```python
import string
# 打开文件并读取内容
with open('filename.txt', 'r') as file:
text = file.read()
# 去除标点符号和换行符
text = text.translate(str.maketrans('', '', string.punctuation))
text = text.replace('\n', ' ')
# 将文本转换为小写字母
text = text.lower()
# 分割文本并统计单词出现的次数
word_counts = {}
for word in text.split():
if word not in word_counts:
word_counts[word] = 0
word_counts[word] += 1
# 输出结果
for word, count in sorted(word_counts.items(), key=lambda x: x[1], reverse=True):
print(f'{word}: {count}')
```
在这个代码中,我们首先打开指定的文件并读取它的内容。然后,我们使用 `translate()` 方法去除标点符号和换行符,并使用 `lower()` 方法将文本转换为小写字母。接下来,我们使用 `split()` 方法分割文本并统计每个单词出现的次数。最后,我们按照单词出现的次数排序并输出结果。
阅读全文