用python语句编写一个能统计文档中词语词频小程序。
时间: 2023-06-06 14:05:45 浏览: 193
python写程序统计词频的方法
当然可以,请见以下示例代码:
```
filename = "your_document.txt" # 文件名和路径
with open(filename, "r", encoding='utf-8') as file: # 打开文件
count_dict = {}
for line in file:
line = line.strip() # 去掉行末尾的空格和换行符
words = line.split() # 把一行分割成单词
for word in words:
if word not in count_dict:
count_dict[word] = 1
else:
count_dict[word] += 1
# 对频率进行排序
sorted_dict = sorted(count_dict.items(), key=lambda x:x[1], reverse=True)
for word, count in sorted_dict:
print(word, count) # 输出结果
```
以上代码会统计给定文档中每个单词出现的频率,并按频率进行从高到低排序输出。须注意,统计结果也可能包含标点符号、空格和换行符等非单词字符,代码中没有进行过滤。如果需要更精细的统计,请考虑使用正则表达式或其他方法。
阅读全文