用python获取一个通用规范汉字文件(TGhanzi.txt)中的每个汉字的拼音、部首、末笔(最后一笔,并写入文件。
时间: 2024-06-11 19:07:04 浏览: 61
获取汉字的拼音
首先,需要准备一个 TGhanzi.txt 文件,里面包含了所有通用规范汉字。然后,我们可以使用第三方库 pypinyin 和 radical 引入汉字拼音和部首的功能。
以下是实现代码:
```python
import pypinyin
from radical import Radical
# 打开 TGhanzi.txt 文件
with open('TGhanzi.txt', 'r', encoding='utf-8') as f:
# 逐行读取每个汉字
for line in f.readlines():
# 去除行末换行符
char = line.strip()
# 获取汉字的拼音
pinyin = pypinyin.lazy_pinyin(char)[0]
# 获取汉字的部首
radical = Radical(char).get_radical()
# 获取汉字的末笔
last_stroke = Radical(char).get_last_stroke()
# 将汉字、拼音、部首、末笔写入文件
with open('result.txt', 'a', encoding='utf-8') as f_output:
f_output.write(f'{char}\t{pinyin}\t{radical}\t{last_stroke}\n')
```
在以上代码中,我们首先打开 TGhanzi.txt 文件并逐行读取每个汉字。然后,通过 pypinyin 库获取汉字的拼音,并通过 radical 库获取汉字的部首和末笔。最后,将汉字、拼音、部首、末笔写入 result.txt 文件中。
需要注意的是,我们在写入文件时使用了 a 模式,即追加模式,这样可以避免每次运行程序都覆盖之前的结果。如果需要每次运行程序都重新生成结果文件,可以将 a 改为 w 模式。
阅读全文