写一个python爬虫程序,爬取网页https://pinyin.thunisoft.com/index.html#/sy中类名为fd的数据
时间: 2024-10-23 15:05:41 浏览: 28
ES 拼音分词器 https://github.com/medcl/elasticsearch-analysis-pinyin
Python爬虫通常使用requests库获取网页内容,然后BeautifulSoup库解析HTML结构。以下是一个基本的Python爬虫示例,用于从指定URL抓取`class`为"fd"的数据:
```python
import requests
from bs4 import BeautifulSoup
# 请求目标网页
url = "https://pinyin.thunisoft.com/index.html#/sy"
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 查找所有class为"fd"的元素
fd_data = soup.find_all(class_='fd')
for item in fd_data:
# 提取数据,这取决于fd元素的具体结构,这里假设它们是text属性
data = item.text.strip()
print(data) # 打印提取到的数据
else:
print(f"请求失败,状态码:{response.status_code}")
阅读全文