用Python获取一个文件中通用规范汉字(8105个)的最后一个部首名称及其拼音。
时间: 2023-05-30 07:01:54 浏览: 49
以下是一个可能的解决方案:
```python
import re
# 打开文件并读取所有行
with open('chinese_characters.txt', 'r', encoding='utf-8') as f:
lines = f.readlines()
# 定义一个字典存储部首名称和拼音
radicals = {}
# 遍历每行
for line in lines:
# 匹配每行的文字和拼音
match = re.match(r'(\S+)\s+(\S+)\s+', line)
if match:
char = match.group(1) # 文字
pinyin = match.group(2) # 拼音
if len(char) == 1: # 只处理单个汉字
radical = ord(char) - 0x4e00 # 计算部首的Unicode码
radical_name = chr(radical + 0x2f00) # 转换为部首名称的Unicode码
# 如果部首名称还没有记录,就添加记录
if radical_name not in radicals:
radicals[radical_name] = pinyin
# 输出所有部首名称和拼音
for radical_name, pinyin in radicals.items():
print(radical_name, pinyin)
```
这里假设通用规范汉字的列表存储在名为`chinese_characters.txt`的文件中,每行格式为`文字 拼音`,例如:
```
一 yī
丁 dīng
七 qī
万 wàn
丈 zhàng
三 sān
上 shàng
下 xià
不 bù
与 yǔ
丑 chǒu
...
```
输出结果将是每个部首名称和对应的拼音,例如:
```
一 yī
丁 dīng
七 qī
万 wàn
丈 zhàng
三 sān
上 shàng
下 xià
不 bù
与 yǔ
丑 chǒu
...
```