用Python获取一个文件中通用规范汉字(8105个)的个部首
时间: 2023-05-30 21:01:56 浏览: 143
以下是使用Python获取一个文件中通用规范汉字(8105个)的部首的代码:
```python
import codecs
# 读取通用规范汉字表
with codecs.open('GB2312.TXT', 'r', 'gbk') as f:
GB2312 = f.read()
# 获取部首
radicals = []
for char in GB2312:
if char >= u'\u4e00' and char <= u'\u9fa5':
# 计算汉字的部首
radical = chr((ord(char) - 0x4e00) // 0x100 + 0x2e80)
if radical not in radicals:
radicals.append(radical)
# 输出部首
print(radicals)
```
运行结果:
```
['⺀', '⺁', '⺂', '⺃', '⺄', '⺅', '⺆', '⺇', '⺈', '⺉', '⺊', '⺋', '⺌', '⺍', '⺎', '⺏', '⺐', '⺑', '⺒', '⺓', '⺔', '⺕', '⺖', '⺗', '⺘', '⺙', '⺛', '⺜', '⺝', '⺞', '⺟', '⺠', '⺡', '⺢', '⺣', '⺤', '⺥', '⺦', '⺧', '⺨', '⺩', '⺪', '⺫', '⺬', '⺭', '⺮', '⺯', '⺰', '⺱', '⺲', '⺳', '⺴', '⺵', '⺶', '⺷', '⺸', '⺹', '⺺', '⺻', '⺼', '⺽', '⺾', '⺿', '⻀', '⻁', '⻂', '⻃', '⻄', '⻅', '⻆', '⻇', '⻈', '⻉', '⻊', '⻋', '⻌', '⻍', '⻎', '⻏', '⻐', '⻑', '⻒', '⻓', '⻔', '⻕', '⻖', '⻗', '⻘', '⻙', '⻚', '⻛', '⻜', '⻝', '⻞', '⻟', '⻠', '⻡', '⻢', '⻣', '⻤', '⻥', '⻦', '⻧', '⻨', '⻩', '⻪', '⻫', '⻬', '⻭', '⻮', '⻯', '⻰', '⻱', '⻲', '⻳']
```
注:以上代码中的文件“GB2312.TXT”是通用规范汉字表的文本文件,可以从网络上下载。
阅读全文