利用python进行词频统计
时间: 2023-09-04 10:09:34 浏览: 102
以下是一个简单的Python程序,用于对文本文件进行词频统计:
```python
import string
def word_count(file_path):
with open(file_path, 'r') as f:
text = f.read().lower()
# 将所有字符转换为小写,方便统计
# 如果需要区分大小写,可以删除上一行
# 删除标点符号
text = text.translate(str.maketrans('', '', string.punctuation))
# 按空格分割单词
words = text.split()
# 使用字典记录单词出现的次数
word_count = {}
for word in words:
if word in word_count:
word_count[word] += 1
else:
word_count[word] = 1
# 按单词出现次数从大到小排序
word_count = sorted(word_count.items(), key=lambda x: x[1], reverse=True)
return word_count
# 示例用法
if __name__ == '__main__':
file_path = 'test.txt'
result = word_count(file_path)
for word, count in result:
print(word, count)
```
该程序可以读取指定路径下的文本文件,统计其中每个单词出现的次数,并按照单词出现次数从大到小排序,最后输出每个单词及其出现次数。该程序使用了Python的标准库函数,不需要额外安装任何第三方库。
阅读全文