写一段爬取中医药信息平台中药材的功能的代码
时间: 2024-10-23 19:10:16 浏览: 28
写一个简单的Python爬虫,使用`requests`库来获取中药材信息,这里以抓取某中医药信息平台(假设是"药典网")为例,我们通常会关注药材名称、描述和价格等基本数据。请注意,这只是一个基础示例,并且实际爬取时需要遵守网站的Robots协议和版权规定:
```python
import requests
from bs4 import BeautifulSoup
def crawl_tcm_info(url):
# 请求网页内容
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'lxml')
# 假设中药材信息在特定class下
tcm_data = soup.find_all(class_='tcm-info')
for item in tcm_data:
name = item.find('h2', class_='name').text # 药材名称
description = item.find('p', class_='description').text # 描述
price = item.find('span', class_='price').text # 价格
print(f"药材名称: {name}")
print(f"药材描述: {description}")
print(f"价格: {price}\n")
else:
print("请求失败,请检查URL.")
# 示例网址,你需要替换为你想爬取的实际页面
url = "https://www.example.com/tcm-list"
crawl_tcm_info(url)
```
阅读全文