帮我构建一个爬虫程序,爬取上市公司的实际控制人和股东人数.
时间: 2024-05-01 07:16:58 浏览: 11
以下是一个简单的爬虫程序,可以爬取上市公司的实际控制人和股东人数:
```python
import requests
from bs4 import BeautifulSoup
# 爬取信息的目标网站
url = 'http://stockpage.10jqka.com.cn/HK01658/'
# 发送http请求,获取网站的html代码
response = requests.get(url)
# 解析html代码,获取实际控制人和股东人数
soup = BeautifulSoup(response.text, 'html.parser')
table = soup.find('table', class_='m_table m_hl')
trs = table.find_all('tr')
for tr in trs:
tds = tr.find_all('td')
if len(tds) == 2:
if tds[0].text == '实际控制人':
print('实际控制人:', tds[1].text)
elif tds[0].text == '股东人数':
print('股东人数:', tds[1].text)
```
解释一下代码:
1. 首先,我们定义了目标网站的URL,即需要爬取信息的网站。
2. 然后,我们使用requests库发送HTTP请求,获取网站的HTML代码。
3. 接着,我们使用BeautifulSoup库解析HTML代码,获取实际控制人和股东人数的信息。
4. 最后,我们遍历解析出来的表格,找到实际控制人和股东人数的行,提取出它们的值并打印出来。
需要注意的是,不同的网站可能有不同的HTML结构和标签,如果要爬取其他网站的信息,需要根据网站的实际情况修改代码。