首页企查查爬虫python代码

企查查爬虫python代码

时间: 2024-08-01 21:00:58 浏览: 156

企查查是一个提供企业信息查询服务的网站，如果需要从企查查抓取数据，通常会涉及到网络爬虫技术。Python因为其简洁易读的语法和丰富的库支持，常用于编写爬虫。下面是一个简单的Python代码片段，使用requests和BeautifulSoup库来获取网页内容并解析： ```python import requests from bs4 import BeautifulSoup # 目标URL url = "https://www.qichacha.com/" def get_company_info(url): # 发送HTTP请求 response = requests.get(url) # 检查请求是否成功 if response.status_code == 200: # 使用BeautifulSoup解析HTML内容 soup = BeautifulSoup(response.text, 'lxml') # 找到需要的数据标签，这取决于企查查的具体页面结构 company_name = soup.find('div', {'class': 'company-name'}).text company_address = soup.find('div', {'class': 'address'}).text # 返回解析出的信息 return company_name, company_address else: print(f"请求失败，状态码：{response.status_code}") return None info = get_company_info(url) if info: company_name, company_address = info print(f"公司名称：{company_name}\n公司地址：{company_address}") else: print("未找到相关数据")

阅读全文