使用python读写文件来实现蒙古文词频统计
时间: 2024-01-30 21:04:14 浏览: 88
好的,我可以为您提供一些代码来实现这个功能。首先,您需要有一个包含蒙古文文本的文件,然后您可以使用Python的内置模块来读取该文件并进行词频统计。
以下是一个简单的示例代码,它可以打开一个文件并计算其中每个单词出现的次数:
```
with open('filename.txt', 'r', encoding='utf-8') as f:
text = f.read()
words = text.split() # 将文本拆分成单词
word_counts = {} # 创建一个字典来存储每个单词的出现次数
for word in words:
if word in word_counts:
word_counts[word] += 1
else:
word_counts[word] = 1
# 按照单词出现次数从高到低排序
sorted_word_counts = sorted(word_counts.items(), key=lambda x: x[1], reverse=True)
# 输出前10个最常出现的单词
for word, count in sorted_word_counts[:10]:
print(word, count)
```
在这个示例中,我们使用 `open` 函数打开一个文件,使用 `read` 方法读取其中的文本。我们将文本分割成单词,并将每个单词的出现次数存储在一个字典中。最后,我们按照单词出现次数从高到低对字典进行排序,并输出前10个最常出现的单词。
请注意,这是一个非常简单的示例代码,仅用于说明如何读取文件和计算词频。在实际应用中,您可能需要进行更多的文本清理和预处理,以确保准确地计算词频。
阅读全文