并进入这些链接爬取各供应商名称,供应商地址
时间: 2024-04-04 21:35:56 浏览: 7
好的,以下是一个基于Python的爬取四川省政府采购网站中公告详情的示例代码,使用了requests和BeautifulSoup库:
```python
import requests
from bs4 import BeautifulSoup
# 构造请求头,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 构造请求url
url = 'http://www.ccgp-sichuan.gov.cn/cms-sc/view/ebulletin.action?bulletinId=638882'
# 发送get请求获取网页源代码
r = requests.get(url, headers=headers)
html = r.text
# 解析网页源代码
soup = BeautifulSoup(html, 'html.parser')
# 找到供应商信息表格
table = soup.find('table', {'class': 'table table-bordered table-striped'})
# 找到供应商名称和地址
name = table.find('td', text='供应商名称').find_next_sibling('td').text.strip()
address = table.find('td', text='供应商地址').find_next_sibling('td').text.strip()
# 输出供应商名称和地址
print(name + ": " + address)
```
这段代码可以使用requests库向具体公告详情页面发送get请求获取网页源代码,通过BeautifulSoup解析页面源代码,找到供应商信息表格并找到供应商名称和地址。你可以根据自己的需求对代码进行修改,比如将获取供应商信息的代码放到循环中,依次获取每个公告详情页面中的供应商信息。同样需要注意的是,爬取政府网站信息需要遵守相关法律法规,切勿违法违规。