写一个爬取企查查公司名称，曾用名，营业状态的python代码

时间: 2024-04-12 14:34:01 浏览: 133

基于Python的企查查爬虫，爬取完整的公司数据+源代码+文档说明

5星 · 资源好评率100%

要爬取企查查（www.qichacha.com）上的公司名称、曾用名和营业状态，您可以使用Python的requests和BeautifulSoup库。以下是一个示例代码： ```python import requests from bs4 import BeautifulSoup def crawl_company_info(company_name): url = f"https://www.qichacha.com/search?key={company_name}" headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36" } response = requests.get(url, headers=headers) if response.status_code == 200: soup = BeautifulSoup(response.text, 'html.parser') # 获取公司名称 company_name = soup.find("a", class_="ma_h1").text.strip() print("公司名称:", company_name) # 获取曾用名 former_names = soup.find_all("span", class_="ma_label") former_names = [name.text.strip() for name in former_names] print("曾用名:", former_names) # 获取营业状态 status = soup.find("span", class_="status").text.strip() print("营业状态:", status) else: print("请求失败") # 调用函数示例 crawl_company_info("腾讯科技（深圳）有限公司") ``` 在上述代码中，`crawl_company_info()`函数接受一个参数`company_name`作为要搜索的公司名称。代码构建了请求URL，并发送GET请求获取企查查网页的HTML响应。然后，使用BeautifulSoup解析HTML响应并提取公司名称、曾用名和营业状态的信息。请注意，为了避免被网站反爬虫机制检测，代码中添加了一个伪装的User-Agent头部信息。这只是一个基本示例，实际应用中可能需要处理更多的异常情况和数据清洗。另外，请确保遵守网站的使用规则，并尊重网站的爬取频率限制。

阅读全文

写一个爬取企查查公司名称，曾用名，营业状态的python代码

相关推荐

python爬取企查查公司工商信息

python爬虫爬取企查查公司工商信息

帮我用python写一个爬取企查查公司名称和地址

python爬取企查查

python 爬取企查查数据

Python selenium 爬取企查查

python requests直接请求+cookies爬取企查查

基于Python的企查查爬虫，爬取完整的公司数据python源码+文档说明(96分期末大作业)

基于Python的企查查爬虫，爬取完整的公司数据.zip

爬取移动端微博信息 简易Python代码

用python写一个爬取图片的爬虫

使用python代码写一个可以爬取动态网页的爬虫

帮我用python写代码爬取网站

爬取酷狗音乐python代码

python爬取网页代码

几行Python代码爬取3000+上市公司的信息

一个爬取网站图片的Python爬虫

Python爬取微博评论代码

最新推荐

RuoYi-Vue 全新 Pro 版本，优化重构所有功能

(源码)基于Spring Boot和MyBatis的订餐管理系统.zip

Untitled Page.pdf

CocosCreator开发视频教程含源码简易塔防开发3.61G

(源码)基于Java的票务管理系统.zip

深入浅出：自定义 Grunt 任务的实践指南

管理建模和仿真的文件

数据可视化在缺失数据识别中的作用

ABB机器人在自动化生产线中是如何进行路径规划和任务执行的？请结合实际应用案例分析。

网络物理突变工具的多点路径规划实现与分析

爬取移动端微博信息简易Python代码