第2关:统计文件中单词出现的次数,并输出出现次数高的前三个单词
时间: 2024-09-25 20:07:24 浏览: 63
北航机试15年第三题,读文件并按字典序统计文件中出现的单词
第二关的挑战通常是文本处理中的基础任务,通常涉及到读取文件内容、分割单词、计数每个单词的出现频率,然后按照频率排序并输出最常见的三个单词。以下是一个简单的Python示例:
```python
def count_words(file_path):
with open(file_path, 'r', encoding='utf-8') as file:
content = file.read().lower() # 转换为小写以避免大小写的区别
words = content.split() # 分割成单词列表
word_count = {} # 用于存储单词及其计数
for word in words:
if word not in word_count:
word_count[word] = 1
else:
word_count[word] += 1
sorted_word_count = sorted(word_count.items(), key=lambda x: x[1], reverse=True) # 按照计数降序排列
top_three = [word[0] for word in sorted_word_count[:3]] # 取出前三个最常出现的单词
return top_three
# 使用函数
file_name = "your_file.txt" # 替换为你要分析的文件名
top_three_words = count_words(file_name)
print(f"出现次数最高的三个单词是:{top_three_words}")
阅读全文