提取网页http://www.yedict.com/zsbs.htm中的部首,并写入文件
时间: 2023-12-17 13:05:43 浏览: 111
网页内容提取
以下是Python代码实现:
```python
import requests
from bs4 import BeautifulSoup
url = 'http://www.yedict.com/zsbs.htm'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
radicals = soup.find_all('a', {'class': 'bs2'})
with open('radicals.txt', 'w') as f:
for radical in radicals:
f.write(radical.text + '\n')
```
解释:
1. 导入requests和BeautifulSoup模块。
2. 定义待提取的网页URL。
3. 发送请求并使用BeautifulSoup解析HTML响应。
4. 使用find_all()方法找到所有class为'bs2'的a标签元素,这些元素包含了所有的部首信息。
5. 打开一个名为'radicals.txt'的文件,并将每个部首信息逐行写入该文件中。
阅读全文