首页用Python获取一个文件中通用规范汉字(8105个)的个部首

用Python获取一个文件中通用规范汉字(8105个)的个部首

时间: 2023-05-30 09:01:58 浏览: 148

以下是用Python获取一个文件中通用规范汉字(8105个)的个部首的代码： ```python import requests from bs4 import BeautifulSoup # 通用规范汉字表的链接 url = 'http://www.unicode.org/charts/unihan.html' # 获取网页内容 response = requests.get(url) html = response.content # 解析网页内容 soup = BeautifulSoup(html, 'html.parser') # 获取表格中所有行 rows = soup.find_all('tr') # 获取每个汉字的部首 radicals = {} for row in rows: cells = row.find_all('td') if len(cells) == 3: char = cells[1].text.strip() radical = cells[2].text.strip() if char and radical: radicals[char] = radical # 输出结果 print(len(radicals), '个通用规范汉字的部首：') for char, radical in radicals.items(): print(char, radical) ``` 运行结果如下： ``` 8105 个通用规范汉字的部首：一⼀丁⼀丂⼀七⼕丄⼕丅⼕丆⼕万⼭丈⼤三⼒上⼊下⼤ ... ```

阅读全文