首页编写Python代码，从给定的文本文件中统计出最常出现的三个单词（中文单词长度大于等于2）

编写Python代码，从给定的文本文件中统计出最常出现的三个单词（中文单词长度大于等于2）

时间: 2024-09-13 16:08:30 浏览: 49

要编写Python代码统计出文本文件中最常出现的三个中文单词，你可以遵循以下步骤： 1. 打开并读取文件。 2. 使用正则表达式或者字符串方法来分割单词。 3. 对单词进行计数。 4. 选出计数最多的三个单词。下面是一个简单的示例代码： ```python import re from collections import Counter # 定义一个函数来统计文件中出现频率最高的三个单词 def get_top_three_words(file_path): # 读取文件内容 with open(file_path, 'r', encoding='utf-8') as file: text = file.read() # 使用正则表达式来匹配中文单词 words = re.findall(r'[\u4e00-\u9fff]+', text) # 对单词进行计数 word_counts = Counter(words) # 获取出现次数最多的三个单词 most_common_words = word_counts.most_common(3) return most_common_words # 假设文本文件路径是 'example.txt' file_path = 'example.txt' top_three_words = get_top_three_words(file_path) print(top_three_words) ``` 请确保你的文本文件编码是UTF-8，并且路径是正确的。这段代码没有考虑标点符号对单词的干扰，如果需要更精确的分割，你可能需要进一步处理文本，比如去除标点符号。

阅读全文