企查查爬虫python代码
时间: 2024-08-01 21:00:58 浏览: 156
企查查是一个提供企业信息查询服务的网站,如果需要从企查查抓取数据,通常会涉及到网络爬虫技术。Python因为其简洁易读的语法和丰富的库支持,常用于编写爬虫。下面是一个简单的Python代码片段,使用requests和BeautifulSoup库来获取网页内容并解析:
```python
import requests
from bs4 import BeautifulSoup
# 目标URL
url = "https://www.qichacha.com/"
def get_company_info(url):
# 发送HTTP请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 使用BeautifulSoup解析HTML内容
soup = BeautifulSoup(response.text, 'lxml')
# 找到需要的数据标签,这取决于企查查的具体页面结构
company_name = soup.find('div', {'class': 'company-name'}).text
company_address = soup.find('div', {'class': 'address'}).text
# 返回解析出的信息
return company_name, company_address
else:
print(f"请求失败,状态码:{response.status_code}")
return None
info = get_company_info(url)
if info:
company_name, company_address = info
print(f"公司名称:{company_name}\n公司地址:{company_address}")
else:
print("未找到相关数据")
阅读全文