首页用Python获取一个文件中通用规范汉字(8105个)的个部首

用Python获取一个文件中通用规范汉字(8105个)的个部首

时间: 2023-05-30 21:01:56 浏览: 143

以下是使用Python获取一个文件中通用规范汉字(8105个)的部首的代码： ```python import codecs # 读取通用规范汉字表 with codecs.open('GB2312.TXT', 'r', 'gbk') as f: GB2312 = f.read() # 获取部首 radicals = [] for char in GB2312: if char >= u'\u4e00' and char <= u'\u9fa5': # 计算汉字的部首 radical = chr((ord(char) - 0x4e00) // 0x100 + 0x2e80) if radical not in radicals: radicals.append(radical) # 输出部首 print(radicals) ``` 运行结果： ``` ['⺀', '⺁', '⺂', '⺃', '⺄', '⺅', '⺆', '⺇', '⺈', '⺉', '⺊', '⺋', '⺌', '⺍', '⺎', '⺏', '⺐', '⺑', '⺒', '⺓', '⺔', '⺕', '⺖', '⺗', '⺘', '⺙', '⺛', '⺜', '⺝', '⺞', '⺟', '⺠', '⺡', '⺢', '⺣', '⺤', '⺥', '⺦', '⺧', '⺨', '⺩', '⺪', '⺫', '⺬', '⺭', '⺮', '⺯', '⺰', '⺱', '⺲', '⺳', '⺴', '⺵', '⺶', '⺷', '⺸', '⺹', '⺺', '⺻', '⺼', '⺽', '⺾', '⺿', '⻀', '⻁', '⻂', '⻃', '⻄', '⻅', '⻆', '⻇', '⻈', '⻉', '⻊', '⻋', '⻌', '⻍', '⻎', '⻏', '⻐', '⻑', '⻒', '⻓', '⻔', '⻕', '⻖', '⻗', '⻘', '⻙', '⻚', '⻛', '⻜', '⻝', '⻞', '⻟', '⻠', '⻡', '⻢', '⻣', '⻤', '⻥', '⻦', '⻧', '⻨', '⻩', '⻪', '⻫', '⻬', '⻭', '⻮', '⻯', '⻰', '⻱', '⻲', '⻳'] ``` 注：以上代码中的文件“GB2312.TXT”是通用规范汉字表的文本文件，可以从网络上下载。

阅读全文