用Pytnon在网页http://code.web.idv.hk/charset/csws1.php上获取通用规范汉字(TGhanzi.txt)每个汉字的部首
时间: 2023-12-18 21:02:57 浏览: 104
获取汉字偏旁部首的小程序 Python版本
以下是使用Python获取通用规范汉字(TGhanzi.txt)每个汉字的部首的代码:
```python
import requests
from bs4 import BeautifulSoup
# 获取TGhanzi.txt文件中的所有汉字
with open('TGhanzi.txt', 'r', encoding='utf-8') as f:
hanzi_list = f.read().splitlines()
# 初始化一个字典,用于存储每个汉字的部首
bushou_dict = {}
# 遍历每个汉字,获取其部首
for hanzi in hanzi_list:
url = 'http://code.web.idv.hk/charset/csws1.php?q={}'.format(hanzi)
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
bushou = soup.find_all('td')[3].text.strip()
bushou_dict[hanzi] = bushou
# 输出结果
for hanzi, bushou in bushou_dict.items():
print('{} 的部首是 {}'.format(hanzi, bushou))
```
运行上述代码,可以得到每个汉字对应的部首。
阅读全文