统计指定文本中的蒙古文单词出现的次数从高到低排序,并将排序结果写到文本件中python
时间: 2024-03-18 15:41:33 浏览: 21
好的,我可以为您提供 Python 代码来完成这个任务。首先,您需要确保在计算机上安装了 Python。然后,您可以按照以下步骤操作:
1. 首先,我们需要打开指定的文本文件,并读取其中的内容。假设您的文件名为 "text.txt",您可以使用以下代码来读取该文件中的内容:
```python
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
```
2. 接下来,我们需要使用正则表达式来提取该文本中的蒙古文单词。下面是一个简单的正则表达式示例,可以用于匹配蒙古文单词:
```python
import re
regex = r'[\u1800-\u18AF]+' # 匹配蒙古文字符范围
matches = re.findall(regex, text)
```
3. 然后,我们可以使用 Python 的 Counter 类来统计每个单词的出现次数,并按照出现次数从高到低排序:
```python
from collections import Counter
word_counts = Counter(matches)
sorted_counts = sorted(word_counts.items(), key=lambda x: x[1], reverse=True)
```
4. 最后,我们可以将排序结果写入一个新的文本文件中:
```python
with open('sorted_counts.txt', 'w', encoding='utf-8') as f:
for word, count in sorted_counts:
f.write(f'{word}: {count}\n')
```
将以上代码块组合起来,您就可以得到一个完整的 Python 脚本,用于统计指定文本中的蒙古文单词出现次数并排序。