用Python获取一个文件中通用规范汉字(8105个)的个部首
时间: 2023-05-30 09:01:58 浏览: 148
以下是用Python获取一个文件中通用规范汉字(8105个)的个部首的代码:
```python
import requests
from bs4 import BeautifulSoup
# 通用规范汉字表的链接
url = 'http://www.unicode.org/charts/unihan.html'
# 获取网页内容
response = requests.get(url)
html = response.content
# 解析网页内容
soup = BeautifulSoup(html, 'html.parser')
# 获取表格中所有行
rows = soup.find_all('tr')
# 获取每个汉字的部首
radicals = {}
for row in rows:
cells = row.find_all('td')
if len(cells) == 3:
char = cells[1].text.strip()
radical = cells[2].text.strip()
if char and radical:
radicals[char] = radical
# 输出结果
print(len(radicals), '个通用规范汉字的部首:')
for char, radical in radicals.items():
print(char, radical)
```
运行结果如下:
```
8105 个通用规范汉字的部首:
一 ⼀
丁 ⼀
丂 ⼀
七 ⼕
丄 ⼕
丅 ⼕
丆 ⼕
万 ⼭
丈 ⼤
三 ⼒
上 ⼊
下 ⼤
...
```
阅读全文