首页使用python读写文件来实现蒙古文词频统计

使用python读写文件来实现蒙古文词频统计

时间: 2024-01-30 21:04:14 浏览: 88

好的，我可以为您提供一些代码来实现这个功能。首先，您需要有一个包含蒙古文文本的文件，然后您可以使用Python的内置模块来读取该文件并进行词频统计。以下是一个简单的示例代码，它可以打开一个文件并计算其中每个单词出现的次数： ``` with open('filename.txt', 'r', encoding='utf-8') as f: text = f.read() words = text.split() # 将文本拆分成单词 word_counts = {} # 创建一个字典来存储每个单词的出现次数 for word in words: if word in word_counts: word_counts[word] += 1 else: word_counts[word] = 1 # 按照单词出现次数从高到低排序 sorted_word_counts = sorted(word_counts.items(), key=lambda x: x[1], reverse=True) # 输出前10个最常出现的单词 for word, count in sorted_word_counts[:10]: print(word, count) ``` 在这个示例中，我们使用 `open` 函数打开一个文件，使用 `read` 方法读取其中的文本。我们将文本分割成单词，并将每个单词的出现次数存储在一个字典中。最后，我们按照单词出现次数从高到低对字典进行排序，并输出前10个最常出现的单词。请注意，这是一个非常简单的示例代码，仅用于说明如何读取文件和计算词频。在实际应用中，您可能需要进行更多的文本清理和预处理，以确保准确地计算词频。

阅读全文